OpenAI ha presentato GPT-4o mini, una versione più piccola ed economica del suo potente modello GPT-4o.
GPT-4o mini viene definito “il modello piccolo più efficiente del mercato”, con prezzi nettamente inferiori a quelli della concorrenza.
Gli sviluppatori pagheranno solo 0,15 dollari per milione di token di input e 0,60 dollari per milione di token di output, rispetto ai 5 e 15 dollari del GPT-4o.
Olivier Godement, responsabile del prodotto API di OpenAI, ha parlato del potenziale del modello con VentureBeat: “Il costo per intelligenza è così buono che mi aspetto che venga utilizzato per tutti i tipi di assistenza clienti, ingegneria del software, scrittura creativa, tutti i tipi di compiti”
Nonostante il nome “mini”, GPT-4o mini vanta capacità impressionanti. Supera il GPT-3.5 Turbo in vari benchmark e può gestire input testuali e visivi.
OpenAI riporta che GPT-4o mini raggiunge un punteggio dell’82,0% nel benchmark Massive Multitask Language Understanding (MMLU), superando concorrenti come Gemini 1.5 Flash di Google (77,9%) e Claude 3 Haiku di Anthropic (73,8%).

Il modello sostituirà GPT-3.5 Turbo per gli abbonati a ChatGPT Plus e Teams, offrendo agli utenti un modello più potente senza costi aggiuntivi.
I primi utilizzatori, tra cui le startup Ramp e Superhuman, hanno riportato risultati promettenti per compiti come la categorizzazione degli scontrini e le risposte personalizzate alle e-mail.
OpenAI vuole affermare la sicurezza del GPT-4o mini
Pur spingendosi oltre i limiti delle capacità e dell’economicità del GPT-4o mini, OpenAI non lesina sulla sicurezza. Utilizza gli stessi meccanismi sviluppati per il modello più grande GPT-4o.
OpenAI ha inoltre coinvolto oltre 70 esperti di psicologia sociale e disinformazione per mettere alla prova il GPT-4o.
Questi specialisti hanno aiutato a identificare i potenziali rischi, consentendo al team di affrontare i problemi prima che diventassero tali. Gli insegnamenti acquisiti sono stati inseriti nel GPT-4o mini.
OpenAI ha anche introdotto quello che chiama il metodo della “gerarchia delle istruzioni”, che “aiuta a migliorare la capacità del modello di resistere a jailbreak, iniezioni di messaggi ed estrazioni di messaggi di sistema. Questo rende le risposte del modello più affidabili e contribuisce a renderne più sicuro l’utilizzo nelle applicazioni su larga scala”
Probabilmente si tratta di una proposta per gli utenti aziendali che vogliono evitare a tutti i costi risultati errati e allucinazioni.
In prospettiva, OpenAI ha in programma di espandere le capacità di GPT-4o mini, compresa la capacità di generare immagini, audio e video. Il modello dovrebbe essere disponibile su Apple Intelligence in autunno, in concomitanza con l’uscita di iOS 18.
Sebbene il GPT-4o mini sia piuttosto interessante, OpenAI ha dovuto affrontare delle battute d’arresto in altre aree. L’azienda ha recentemente ritardato il rilascio delle funzioni di lettura della voce e delle emozioni per ChatGPT, citando la necessità di ulteriori test di sicurezza.
Le persone sono rimaste sbalordite quando l’azienda ha presentato GPT-4o e la sua sintesi vocale, ma da allora le cose si sono calmate.
Tuttavia, GPT-4o mini dimostra che le persone di OpenAI stanno ancora lavorando sodo nonostante le recenti controversie.



