ai marketing italia

la prima agenzia dedicata a far crescere la tua pmi con l'intelligenza artificiale

xAI presenta Grok-2 per sfidare la gerarchia delle IA

xAI ha annunciato il rilascio di Grok-2, un aggiornamento importante che vanta capacità migliorate nella chat, nel coding e nel ragionamento.

Oltre a Grok-2, xAI ha introdotto Grok-2 mini, una versione più piccola ma capace del modello principale. Entrambi sono attualmente in beta su X e saranno resi disponibili attraverso le API aziendali di xAI nel corso del mese.

Una prima versione di Grok-2 è stata testata nella classifica di LMSYS con lo pseudonimo di “sus-column-r”.

Al momento dell’annuncio, xAI sostiene che Grok-2 sta superando sia Claude 3.5 Sonnet di Anthropic che GPT-4-Turbo di OpenAI. Tuttavia, vale la pena notare che GPT-4o detiene attualmente il primo posto come miglior assistente AI in termini di capacità complessive, seguito da Gemini 1.5 di Google.

il processo di valutazione interna di xAI impiega tutor di intelligenza artificiale per valutare i modelli in vari compiti del mondo reale. L’azienda afferma che “Grok-2 ha mostrato miglioramenti significativi nel ragionamento con i contenuti recuperati e nelle sue capacità di utilizzo degli strumenti, come l’identificazione corretta delle informazioni mancanti, il ragionamento sulle sequenze di eventi e lo scarto dei post irrilevanti”.

I risultati dei benchmark condivisi da xAI indicano che sia Grok-2 che Grok-2 mini mostrano miglioramenti sostanziali rispetto a Grok-1.5. I modelli mostrano prestazioni competitive in aree come le conoscenze scientifiche di livello universitario, le conoscenze generali e i problemi di competizione matematica. In particolare, Grok-2 eccelle nei compiti basati sulla visione, offrendo prestazioni all’avanguardia nel ragionamento matematico visivo e nella risposta a domande basate su documenti.

La nuova esperienza di Grok su X presenta un’interfaccia ridisegnata e nuove funzionalità. Gli abbonati Premium e Premium avranno accesso sia a Grok-2 che a Grok-2 mini. xAI descrive Grok-2 come “più intuitivo, orientabile e versatile in un’ampia gamma di attività, sia che tu stia cercando risposte, collaborando alla scrittura o risolvendo compiti di codifica”.

xAI sta inoltre collaborando con Black Forest Labs per sperimentare il loro modello FLUX.1 ed espandere le capacità di Grok su X.

Per gli sviluppatori, xAI lancerà una piattaforma API aziendale alla fine del mese. L’azienda promette funzioni di sicurezza migliorate, statistiche sul traffico e analisi di fatturazione avanzate. Sarà inoltre disponibile un’API di gestione per integrare la gestione di team, utenti e fatturazione negli strumenti e nei servizi esistenti.

In prospettiva, xAI prevede di introdurre la comprensione multimodale come parte integrante dell’esperienza Grok sia su X che sulle API. I rapidi progressi compiuti dall’azienda dopo l’annuncio di Grok-1 nel novembre 2023 sono attribuiti a “un piccolo team con la massima densità di talenti”.

l’attenzione di xAI rimane concentrata sull’avanzamento delle capacità di ragionamento di base con il suo nuovo cluster di calcolo, con l’obiettivo di mantenere la sua posizione all’avanguardia nello sviluppo dell’IA. Tuttavia, l’azienda ha recentemente deciso di interrompere l’uso di alcuni dati dell’UE per l’addestramento dei suoi modelli.

Sebbene il rilascio di Grok-2 segni una pietra miliare significativa per xAI, è chiaro che il panorama dell’IA rimane altamente competitivo. Con ChatGPT-4o e Gemini 1.5 di Google in testa al gruppo e altri importanti attori come Anthropic che continuano a fare progressi, la corsa alla supremazia dell’IA è tutt’altro che finita.

Leggi di più su www.artificialintelligence-news.com

altre news