Segui TivuStream

DeepSeek è un modello AI emergente dalle promesse innovative, è sviluppato in Cina, è Open Source, è (nella quasi totalità di funzioni) Gratuito. Il successo che sta avendo e che sta proiettando DeepSeek in cima alle classifiche dei Modelli AI per uso e frequenza, si basa su alcuni punti chiave che lo differenziano da alternative consolidate come ChatGPT.

DeepSeek
DeepSeek

Caratteristiche distintive

  1. Architettura innovativa: DeepSeek utilizza un approccio “Mixture-of-Experts” (MoE), che attiva solo una parte del suo modello di 671 miliardi di parametri in base al compito. Ciò consente maggiore efficienza nei compiti specifici, come coding avanzato e problemi matematici complessi, con un minor consumo di risorse computazionali rispetto ai modelli densi come ChatGPT
  2. Focus sulla specializzazione: È progettato per eccellere in ambiti specifici, come programmazione, logica e matematica, risultando più performante in queste aree rispetto a modelli generalisti. La sua versatilità nei compiti generali o creativi, nononstante viaggi ad ottimi livelli , al momento è di poco inferiore rispetto a ChatGPT.
  3. Accessibilità e costi ridotti: DeepSeek è open-source e disponibile gratuitamente, il che rappresenta un grande vantaggio per startup e aziende che vogliono integrare un’IA senza pagare abbonamenti premium come quelli richiesti da ChatGPT Pro. E’ un modello estremamente interessante per gli sviluppatori che, grazie all’Open Source, posso utilizzare le sue API ed adattare il il codice a specifiche esigenze.
  4. Privacy e trasparenza: Essendo open-source, consente un maggiore controllo sul modello e sui dati utilizzati. L’accesso al source è pubblico ed è totalmente verificabile.

Perché DeepSeek sta guadagnando così tanta popolarità

  • Efficienza e scalabilità: Il modello è altamente ottimizzato per compiti specifici, offrendo prestazioni competitive a costi inferiori.
  • Alternativa etica ed economica: Essendo open-source, sta attirando sviluppatori e organizzazioni che preferiscono modelli trasparenti e personalizzabili.
  • Riconoscimenti internazionali: DeepSeek è considerato all’altezza dei migliori modelli americani da esperti del settore, come Alexandr Wang di Scale AI, valutazione che aumenta la credibilità di DeepSeek nel mercato globale.

Limitazioni

DeepSeek non è privo di difetti. Ha mostrato lacune in compiti generali e una certa tendenza a introdurre bias nei risultati, specialmente in scenari legati a restrizioni culturali o politiche. Il fatto che sia nata in Cina evidentemente, viste le restrizioni e censure in Patria, può “glissare” alcune risposte specifiche sui regimi Orientali.

Va detto comunque che DeepSeek è l’ultima arrivata nello scenario delle AI e di conseguenza ha meno esperienza rispetto ai modelli concorrenti, ma i dati parlano chiaro:

Funzionalità di DeepSeek-V3

DeepSeek-V3 ha raggiunto un significativo passo avanti nella velocità di inferenza rispetto ai modelli precedenti: è in cima alla classifica dei modelli open-source e compete con i modelli closed-source più avanzati a livello globale.

Benchmark (Metric)DeepSeek V3DeepSeek V2.5Qwen2.5Llama3.1Claude-3.5GPT-4o
090572B-Inst405B-InstSonnet-10220513
ArchitectureMoEMoEDenseDense
# Activated Params37B21B72B405B
# Total Params671B236B72B405B
EnglishMMLU (EM)88.580.685.388.688.387.2
MMLU-Redux (EM)89.180.385.686.288.988.0
MMLU-Pro (EM)75.966.271.673.378.072.6
DROP (3-shot F1)91.687.876.788.788.383.7
IF-Eval (Prompt Strict)86.180.684.186.086.584.3
GPQA-Diamond (Pass@1)59.141.349.051.165.049.9
SimpleQA (Correct)24.910.29.117.128.438.2
FRAMES (Acc.)73.365.469.870.072.580.5
LongBench v2 (Acc.)48.735.439.436.141.048.1
CodeHumanEval-Mul (Pass@1)82.677.477.377.281.780.5
LiveCodeBench (Pass@1-COT)40.529.231.128.436.333.4
LiveCodeBench (Pass@1)37.628.428.730.132.834.2
Codeforces (Percentile)51.635.624.825.320.323.6
SWE Verified (Resolved)42.022.623.824.550.838.8
Aider-Edit (Acc.)79.771.665.463.984.272.9
Aider-Polyglot (Acc.)49.618.27.65.845.316.0
MathAIME 2024 (Pass@1)39.216.723.323.316.09.3
MATH-500 (EM)90.274.780.073.878.374.6
CNMO 2024 (Pass@1)43.210.815.96.813.110.8
ChineseCLUEWSC (EM)90.990.491.484.785.487.9
C-Eval (EM)86.579.586.161.576.776.0
C-SimpleQA (Correct)64.154.148.450.451.359.3

DeepSeek si sta affermando come un’opzione valida per i settori che richiedono specializzazione tecnica e controllo sui costi, Al momento non è ancora, totalmente, un concorrente diretto ideale per gli usi più versatili e creativi di ChatGPT.

L’esecuzione locale di DeepSeek AI è attualmente supportata solo su sistemi operativi basati su Linux, come confermato dalla documentazione ufficiale e da fonti secondarie​ Questo è dovuto principalmente ai requisiti di librerie specifiche, ottimizzate per l’ambiente Linux, ed alla dipendenza dal CUDA Toolkit per le GPU NVIDIA, che ha prestazioni più stabili su Linux.

DeepSeek è anche una App per sistemi Android ed iOS scaricabile dagli Store Apple Oppure Huawei App Gallery oltre a store riservati a Paesi orientali. C’è anchela possibilità di scaricare il file .apk cliccando su Alternative Download Methods da questa pagina:

https://cdn.deepseek.com/download-app/index.html

DeepSeek da Browser

L’utilizzo di DeepSeek AI via browser è simile a quello di ChatGPT in termini di interfaccia e funzionalità principali. Dopo aver effettuato la registrazione sul sito di DeepSeek, si accede ad una chat interattiva semplice e intuitiva, con una barra di testo in cui inserire le domande e un pulsante per inviarle. La risposta viene fornita rapidamente dal modello, supportando funzioni come generazione di testo, debug di codice e risoluzione di problemi matematici.

Una differenza interessante rispetto a ChatGPT è l’integrazione nativa con la ricerca online in tempo reale, che permette a DeepSeek di combinare le informazioni presenti sul web con i suoi dati di addestramento.

TAG AI

Visto: 142

Grazie del tuo interesse, se desideri rimanere aggiornato iscriviti alla nostra Newsletter !

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.