Vai al contenuto

Mistral Large 3: L’Europa sfida l’IA con il nuovo modello

La società francese Mistral AI ha annunciato il rilascio della sua nuova generazione di modelli, denominata Mistral 3. Tra questi spicca Mistral Large 3, un modello Mixture-of-Experts (MoE) sparse con 675 miliardi di parametri totali, di cui 41 miliardi attivi per token, addestrato su GPU NVIDIA H200.

Mistral Large 3 è il primo modello di Mistral ad adottare un’architettura MoE al di fuori della serie Mixtral, che non ha subito aggiornamenti da oltre un anno e mezzo.

Insieme al modello principale, sono state presentate tre varianti dense: Ministral 3 3B, 8B e 14B. Questi modelli sono multimodali e multilingua, rilasciati con licenza Apache 2.0 in versioni base, instruct e reasoning.

Le prestazioni di Mistral Large 3, secondo quanto riportato, sono competitive. Nel leaderboard LMSYS Arena, il modello si colloca al secondo posto tra i modelli open non-reasoning e al sesto posto assoluto. È prevista una futura versione con capacità di ragionamento.

Tuttavia, in confronto con DeepSeek R1, rilasciato a gennaio, Mistral Large 3 sembra mostrare difficoltà in prove particolarmente complesse come GPQA Diamond.

Nello specifico, su GPQA Diamond (5-shot, no CoT), DeepSeek R1 raggiunge il 71,5% contro il 43,9% di Mistral Large 3.

Anche Kimi-K2, sviluppato da Moonshot AI, una startup con sede a Pechino fondata da ex studenti dell’Università Tsinghua e sostenuta finanziariamente da Alibaba, ottiene risultati migliori in diversi benchmark.

La serie Ministral 3, più piccola, è progettata per l’efficienza edge e si distingue per il suo rapporto costo/prestazioni. Il modello 14B reasoning raggiunge l’85% su AIME 2025 e i modelli producono, in media, un numero inferiore di token rispetto a concorrenti con pari accuratezza.

L’intera famiglia di modelli è già ottimizzata per TensorRT-LLM, vLLM e Blackwell, e sarà disponibile su NVIDIA NIM, AWS SageMaker e le principali piattaforme open-source.

Secondo quanto indicato, Mistral è una delle principali realtà europee nel settore, ma i dati suggeriscono un divario crescente con altri continenti, in particolare nei task di ragionamento puro, dove i laboratori asiatici sembrano aver stabilito nuovi standard.

Entra nella community su Telegram

Vai al gruppo
Google News Ricevi le nostre ultime notizie da Google News clicca su SEGUICI, poi nella nuova schermata clicca sul pulsante con la stella.
SEGUICI

Articoli correlati

Autore

0 0 voti
Valutazione dell'articolo
Iscriviti
Notificami
guest
0 Commenti
Vecchi
Più recenti Le più votate
Feedback in linea
Visualizza tutti i commenti
0
Esprimete la vostra opinione commentando.x