Modello di intelligenza artificiale da un trilione di parametri: Il lancio del Ling-1T di Ant Group

Ant Group ha fatto il suo ingresso nell’arena dei modelli di intelligenza artificiale da un trilione di parametri con Ling-1T, un nuovo modello linguistico open-sourced che il gigante cinese del settore fintech considera una svolta nel bilanciamento tra efficienza computazionale e capacità di ragionamento avanzate.

L’annuncio del 9 ottobre segna una pietra miliare significativa per l’operatore Alipay, che sta rapidamente sviluppando la sua infrastruttura di intelligenza artificiale attraverso diverse architetture di modelli.

Il modello di intelligenza artificiale da un trilione di parametri ha dimostrato prestazioni competitive in compiti di ragionamento matematico complessi, raggiungendo un’accuratezza del 70,42% nel benchmark dell’American Invitational Mathematics Examination (AIME) del 2025, uno standard utilizzato per valutare le capacità di risoluzione dei problemi dei sistemi di intelligenza artificiale.

Modello di intelligenza artificiale da un trilione di parametri: Il lancio del Ling-1T di Ant Group

Secondo le specifiche tecniche di Ant Group, Ling-1T mantiene questo livello di prestazioni pur consumando una media di oltre 4.000 token di output per problema, collocandosi tra quelli che l’azienda descrive come “i migliori modelli di IA della categoria” in termini di qualità dei risultati.

Un approccio duplice al progresso dell’IA

Il rilascio di un modello di intelligenza artificiale da un trilione di parametri coincide con il lancio da parte di Ant Group di dInfer, un framework di inferenza specializzato per modelli linguistici a diffusione. Questa strategia di rilascio parallelo riflette la scommessa dell’azienda su più approcci tecnologici piuttosto che su un unico paradigma architettonico.

I modelli linguistici a diffusione rappresentano una svolta rispetto ai sistemi autoregressivi che sono alla base di chatbot molto diffusi come ChatGPT. A differenza della generazione sequenziale del testo, i modelli di diffusione producono output in parallelo, un approccio già diffuso negli strumenti di generazione di immagini e video ma meno comune nell’elaborazione del linguaggio.

I parametri di prestazione di Ant Group per dInfer indicano un sostanziale aumento dell’efficienza. I test condotti sul modello di diffusione LLaDA-MoE dell’azienda hanno prodotto 1.011 tokens al secondo nel benchmark di codifica HumanEval, contro i 91 tokens al secondo del framework Fast-dLLM di Nvidia e i 294 del modello Qwen-2.5-3B di Alibaba eseguito su infrastruttura vLLM.

“Riteniamo che dInfer fornisca un toolkit pratico e una piattaforma standardizzata per accelerare la ricerca e lo sviluppo nel campo in rapida crescita dei dLLM”, hanno dichiarato i ricercatori di Ant Group nella documentazione tecnica allegata.

Espansione dell’ecosistema oltre i modelli linguistici

Il modello di intelligenza artificiale Ling-1T da un trilione di parametri si colloca all’interno di una più ampia famiglia di sistemi di intelligenza artificiale che Ant Group ha assemblato negli ultimi mesi.

Il portafoglio dell’azienda comprende ora tre serie principali: i modelli Ling non pensanti per compiti linguistici standard, i modelli Ring pensanti progettati per ragionamenti complessi (tra cui il Ring-1T-preview precedentemente rilasciato) e i modelli multimodali Ming in grado di elaborare immagini, testi, audio e video.

Questo approccio diversificato si estende a un modello sperimentale denominato LaDA-MoE, che impiega l’architettura Mixture-of-Experts (MoE), una tecnica che attiva solo le porzioni rilevanti di un modello di grandi dimensioni per compiti specifici, migliorando teoricamente l’efficienza.

He Zhengyu, Chief Technology Officer di Ant Group, ha illustrato il posizionamento dell’azienda in merito a questi rilasci. “In Ant Group crediamo che l’Intelligenza Artificiale Generale (AGI) debba essere un bene pubblico, una pietra miliare condivisa per il futuro intelligente dell’umanità”, ha dichiarato, aggiungendo che i rilasci open-source del modello di AI da un trilione di parametri e dell’anteprima Ring-1T rappresentano dei passi avanti verso un “progresso aperto e collaborativo”

Dinamiche competitive in un ambiente limitato

La tempistica e la natura dei rilasci di Ant Group illuminano i calcoli strategici all’interno del settore cinese dell’IA. Con l’accesso alla tecnologia dei semiconduttori all’avanguardia limitato dalle restrizioni all’esportazione, le aziende tecnologiche cinesi hanno sempre più enfatizzato l’innovazione algoritmica e l’ottimizzazione del software come fattori di differenziazione competitiva.

ByteDance, società madre di TikTok, ha introdotto a luglio un modello di linguaggio di diffusione chiamato Seed Diffusion Preview, dichiarando di aver migliorato la velocità di cinque volte rispetto ad architetture autoregressive simili. Questi sforzi paralleli suggeriscono l’interesse dell’industria per paradigmi di modelli alternativi che potrebbero offrire vantaggi in termini di efficienza.

Tuttavia, la traiettoria di adozione pratica dei modelli linguistici a diffusione rimane incerta. I sistemi autoregressivi continuano a dominare le implementazioni commerciali grazie alle prestazioni comprovate nella comprensione e nella generazione del linguaggio naturale, requisiti fondamentali per le applicazioni rivolte ai clienti.

Strategia open-source come posizionamento sul mercato

Rendendo disponibile pubblicamente il modello di intelligenza artificiale da un trilione di parametri insieme al framework dInfer, Ant Group sta perseguendo un modello di sviluppo collaborativo che contrasta con gli approcci chiusi di alcuni concorrenti.

Questa strategia è potenzialmente in grado di accelerare l’innovazione e di posizionare le tecnologie di Ant come infrastrutture fondamentali per la più ampia comunità dell’IA.

Contemporaneamente l’azienda sta sviluppando AWorld, un framework destinato a supportare l’apprendimento continuo degli agenti di IA autonomi, sistemi progettati per portare a termine compiti indipendenti per conto degli utenti.

La capacità di questi sforzi combinati di affermare Ant Group come una forza significativa nello sviluppo dell’IA globale dipende in parte dalla convalida nel mondo reale delle prestazioni dichiarate e in parte dai tassi di adozione tra gli sviluppatori che cercano alternative alle piattaforme consolidate.

La natura open-source del modello di IA da un trilione di parametri può facilitare questo processo di validazione e creare una comunità di utenti che investano nel successo della tecnologia.

Per il momento, i rilasci dimostrano che le principali aziende tecnologiche cinesi ritengono che l’attuale panorama dell’IA sia abbastanza fluido da accogliere nuovi operatori disposti a innovare su più dimensioni contemporaneamente.

Leggi di più su www.artificialintelligence-news.com