DeepSeek l’AI che sta scalzando Chat GPT

buio

28/01/2025
05/03/2026
4 min read

DeepSeek è un modello AI emergente dalle promesse innovative, è sviluppato in Cina, è Open Source, è (nella quasi totalità di funzioni) Gratuito. Il successo che sta avendo e che sta proiettando DeepSeek in cima alle classifiche dei Modelli AI per uso e frequenza, si basa su alcuni punti chiave che lo differenziano da alternative consolidate come ChatGPT.

Caratteristiche distintive

Architettura innovativa: DeepSeek utilizza un approccio “Mixture-of-Experts” (MoE), che attiva solo una parte del suo modello di 671 miliardi di parametri in base al compito. Ciò consente maggiore efficienza nei compiti specifici, come coding avanzato e problemi matematici complessi, con un minor consumo di risorse computazionali rispetto ai modelli densi come ChatGPT
Focus sulla specializzazione: È progettato per eccellere in ambiti specifici, come programmazione, logica e matematica, risultando più performante in queste aree rispetto a modelli generalisti. La sua versatilità nei compiti generali o creativi, nononstante viaggi ad ottimi livelli , al momento è di poco inferiore rispetto a ChatGPT.
Accessibilità e costi ridotti: DeepSeek è open-source e disponibile gratuitamente, il che rappresenta un grande vantaggio per startup e aziende che vogliono integrare un’IA senza pagare abbonamenti premium come quelli richiesti da ChatGPT Pro. E’ un modello estremamente interessante per gli sviluppatori che, grazie all’Open Source, posso utilizzare le sue API ed adattare il il codice a specifiche esigenze.
Privacy e trasparenza: Essendo open-source, consente un maggiore controllo sul modello e sui dati utilizzati. L’accesso al source è pubblico ed è totalmente verificabile.

Perché DeepSeek sta guadagnando così tanta popolarità

Efficienza e scalabilità: Il modello è altamente ottimizzato per compiti specifici, offrendo prestazioni competitive a costi inferiori.
Alternativa etica ed economica: Essendo open-source, sta attirando sviluppatori e organizzazioni che preferiscono modelli trasparenti e personalizzabili.
Riconoscimenti internazionali: DeepSeek è considerato all’altezza dei migliori modelli americani da esperti del settore, come Alexandr Wang di Scale AI, valutazione che aumenta la credibilità di DeepSeek nel mercato globale.

Limitazioni

DeepSeek non è privo di difetti. Ha mostrato lacune in compiti generali e una certa tendenza a introdurre bias nei risultati, specialmente in scenari legati a restrizioni culturali o politiche. Il fatto che sia nata in Cina evidentemente, viste le restrizioni e censure in Patria, può “glissare” alcune risposte specifiche sui regimi Orientali.

Va detto comunque che DeepSeek è l’ultima arrivata nello scenario delle AI e di conseguenza ha meno esperienza rispetto ai modelli concorrenti, ma i dati parlano chiaro:

Funzionalità di DeepSeek-V3

DeepSeek-V3 ha raggiunto un significativo passo avanti nella velocità di inferenza rispetto ai modelli precedenti: è in cima alla classifica dei modelli open-source e compete con i modelli closed-source più avanzati a livello globale.

	Benchmark (Metric)	DeepSeek V3	DeepSeek V2.5	Qwen2.5	Llama3.1	Claude-3.5	GPT-4o
	Benchmark (Metric)		0905	72B-Inst	405B-Inst	Sonnet-1022	0513

	Architecture	MoE	MoE	Dense	Dense	–	–

	# Activated Params	37B	21B	72B	405B	–	–

	# Total Params	671B	236B	72B	405B	–	–
English	MMLU (EM)	88.5	80.6	85.3	88.6	88.3	87.2
	MMLU-Redux (EM)	89.1	80.3	85.6	86.2	88.9	88.0
	MMLU-Pro (EM)	75.9	66.2	71.6	73.3	78.0	72.6
	DROP (3-shot F1)	91.6	87.8	76.7	88.7	88.3	83.7
	IF-Eval (Prompt Strict)	86.1	80.6	84.1	86.0	86.5	84.3
	GPQA-Diamond (Pass@1)	59.1	41.3	49.0	51.1	65.0	49.9
	SimpleQA (Correct)	24.9	10.2	9.1	17.1	28.4	38.2
	FRAMES (Acc.)	73.3	65.4	69.8	70.0	72.5	80.5
	LongBench v2 (Acc.)	48.7	35.4	39.4	36.1	41.0	48.1
Code	HumanEval-Mul (Pass@1)	82.6	77.4	77.3	77.2	81.7	80.5
	LiveCodeBench (Pass@1-COT)	40.5	29.2	31.1	28.4	36.3	33.4
	LiveCodeBench (Pass@1)	37.6	28.4	28.7	30.1	32.8	34.2
	Codeforces (Percentile)	51.6	35.6	24.8	25.3	20.3	23.6
	SWE Verified (Resolved)	42.0	22.6	23.8	24.5	50.8	38.8
	Aider-Edit (Acc.)	79.7	71.6	65.4	63.9	84.2	72.9
	Aider-Polyglot (Acc.)	49.6	18.2	7.6	5.8	45.3	16.0
Math	AIME 2024 (Pass@1)	39.2	16.7	23.3	23.3	16.0	9.3
	MATH-500 (EM)	90.2	74.7	80.0	73.8	78.3	74.6
	CNMO 2024 (Pass@1)	43.2	10.8	15.9	6.8	13.1	10.8
Chinese	CLUEWSC (EM)	90.9	90.4	91.4	84.7	85.4	87.9
	C-Eval (EM)	86.5	79.5	86.1	61.5	76.7	76.0
	C-SimpleQA (Correct)	64.1	54.1	48.4	50.4	51.3	59.3

DeepSeek si sta affermando come un’opzione valida per i settori che richiedono specializzazione tecnica e controllo sui costi, Al momento non è ancora, totalmente, un concorrente diretto ideale per gli usi più versatili e creativi di ChatGPT.

L’esecuzione locale di DeepSeek AI è attualmente supportata solo su sistemi operativi basati su Linux, come confermato dalla documentazione ufficiale e da fonti secondarie Questo è dovuto principalmente ai requisiti di librerie specifiche, ottimizzate per l’ambiente Linux, ed alla dipendenza dal CUDA Toolkit per le GPU NVIDIA, che ha prestazioni più stabili su Linux.

DeepSeek è anche una App per sistemi Android ed iOS scaricabile dagli Store Apple Oppure Huawei App Gallery oltre a store riservati a Paesi orientali. C’è anchela possibilità di scaricare il file .apk cliccando su Alternative Download Methods da questa pagina:

https://cdn.deepseek.com/download-app/index.html

DeepSeek da Browser

L’utilizzo di DeepSeek AI via browser è simile a quello di ChatGPT in termini di interfaccia e funzionalità principali. Dopo aver effettuato la registrazione sul sito di DeepSeek, si accede ad una chat interattiva semplice e intuitiva, con una barra di testo in cui inserire le domande e un pulsante per inviarle. La risposta viene fornita rapidamente dal modello, supportando funzioni come generazione di testo, debug di codice e risoluzione di problemi matematici.

Una differenza interessante rispetto a ChatGPT è l’integrazione nativa con la ricerca online in tempo reale, che permette a DeepSeek di combinare le informazioni presenti sul web con i suoi dati di addestramento.

TAG AI