Il modello sperimentale Gemini 1.5 Pro di Google ha superato il GPT-4o di OpenAI nei benchmark dell’IA generativa.
Nell’ultimo anno, GPT-4o di OpenAI e Claude-3 di Anthropic hanno dominato il panorama. Tuttavia, l’ultima versione di Gemini 1.5 Pro sembra aver preso il sopravvento.
Uno dei benchmark più riconosciuti nella comunità dell’IA è la LMSYS Chatbot Arena, che valuta i modelli su vari compiti e assegna un punteggio di competenza complessivo. In questa classifica, GPT-4o ha ottenuto un punteggio di 1.286, mentre Claude-3 ha ottenuto un lodevole 1.271. Una precedente iterazione di Gemini 1.5 Pro aveva ottenuto 1.261.

La versione sperimentale di Gemini 1.5 Pro (designata come Gemini 1.5 Pro 0801) ha superato i suoi rivali più prossimi con un impressionante punteggio di 1.300. Questo significativo miglioramento suggerisce che l’ultimo modello di Google potrebbe possedere maggiori capacità complessive rispetto ai suoi concorrenti.
Vale la pena notare che, sebbene i benchmark forniscano indicazioni preziose sulle prestazioni di un modello di intelligenza artificiale, non sempre rappresentano accuratamente l’intero spettro delle sue capacità o dei suoi limiti nelle applicazioni reali.
Nonostante l’attuale disponibilità di Gemini 1.5 Pro, il fatto che sia etichettato come un rilascio anticipato o in fase di test suggerisce che Google potrebbe ancora apportare modifiche o addirittura ritirare il modello per motivi di sicurezza o di allineamento.
Questo sviluppo segna una pietra miliare significativa nella corsa alla supremazia dell’intelligenza artificiale tra i giganti della tecnologia. La capacità di Google di superare OpenAI e Anthropic nei punteggi di benchmark dimostra il rapido ritmo dell’innovazione nel settore e l’intensa competizione che guida questi progressi.
Poiché il panorama dell’IA continua a evolversi, sarà interessante vedere come OpenAI e Anthropic risponderanno alla sfida di Google. Saranno in grado di recuperare la loro posizione in cima alla classifica o Google ha stabilito un nuovo standard per le prestazioni dell’IA generativa?
Exciting News from Chatbot Arena!@GoogleDeepMind‘s new Gemini 1.5 Pro (Experimental 0801) has been tested in Arena for the past week, gathering over 12K community votes.
For the first time, Google Gemini has claimed the #1 spot, surpassing GPT-4o/Claude-3.5 with an impressive… https://t.co/SvjBegXbQ9 pic.twitter.com/6MTHdty1jb
— lmsys.org (@lmsysorg) August 1, 2024
Vuoi saperne di più sull’IA e sui Big Data dai leader del settore? Dai un’occhiata all’ AI & Big Data Expo che si terrà ad Amsterdam, in California e a Londra. L’evento completo è in concomitanza con altri eventi di spicco come Intelligent Automation Conference, BlockX, Digital Transformation Week e Cyber Security & Cloud Expo.
Scopri gli altri eventi tecnologici aziendali e i webinar di TechForge qui.




