La società francese Mistral AI ha annunciato il rilascio della sua nuova generazione di modelli, denominata Mistral 3. Tra questi spicca Mistral Large 3, un modello Mixture-of-Experts (MoE) sparse con 675 miliardi di parametri totali, di cui 41 miliardi attivi per token, addestrato su GPU NVIDIA H200.
Mistral Large 3 è il primo modello di Mistral ad adottare un’architettura MoE al di fuori della serie Mixtral, che non ha subito aggiornamenti da oltre un anno e mezzo.
Insieme al modello principale, sono state presentate tre varianti dense: Ministral 3 3B, 8B e 14B. Questi modelli sono multimodali e multilingua, rilasciati con licenza Apache 2.0 in versioni base, instruct e reasoning.
Le prestazioni di Mistral Large 3, secondo quanto riportato, sono competitive. Nel leaderboard LMSYS Arena, il modello si colloca al secondo posto tra i modelli open non-reasoning e al sesto posto assoluto. È prevista una futura versione con capacità di ragionamento.
Tuttavia, in confronto con DeepSeek R1, rilasciato a gennaio, Mistral Large 3 sembra mostrare difficoltà in prove particolarmente complesse come GPQA Diamond.
Nello specifico, su GPQA Diamond (5-shot, no CoT), DeepSeek R1 raggiunge il 71,5% contro il 43,9% di Mistral Large 3.
Anche Kimi-K2, sviluppato da Moonshot AI, una startup con sede a Pechino fondata da ex studenti dell’Università Tsinghua e sostenuta finanziariamente da Alibaba, ottiene risultati migliori in diversi benchmark.
La serie Ministral 3, più piccola, è progettata per l’efficienza edge e si distingue per il suo rapporto costo/prestazioni. Il modello 14B reasoning raggiunge l’85% su AIME 2025 e i modelli producono, in media, un numero inferiore di token rispetto a concorrenti con pari accuratezza.
L’intera famiglia di modelli è già ottimizzata per TensorRT-LLM, vLLM e Blackwell, e sarà disponibile su NVIDIA NIM, AWS SageMaker e le principali piattaforme open-source.
Secondo quanto indicato, Mistral è una delle principali realtà europee nel settore, ma i dati suggeriscono un divario crescente con altri continenti, in particolare nei task di ragionamento puro, dove i laboratori asiatici sembrano aver stabilito nuovi standard.
Europa alla riscossa con il nuovo modello Mistral Large 3
Ricevi le nostre ultime notizie da Google News
clicca su SEGUICI, poi nella nuova schermata clicca sul pulsante con la stella.

