ChatGPT acquisisce la capacità agent per la ricerca complessa

OpenAI sta rilasciando una potente funzionalità agenziale che consente a ChatGPT di svolgere attività di ricerca complesse e in più fasi online. La funzione, chiamata Deep Research, secondo quanto riferito, riesce a realizzare in decine di minuti ciò che potrebbe richiedere ore o addirittura giorni a un ricercatore umano.

OpenAI descrive Deep Research come una pietra miliare significativa nel suo percorso verso l’intelligenza artificiale generale (AGI).

“La capacità di sintetizzare la conoscenza è un prerequisito per creare nuova conoscenza”, afferma OpenAI. “Per questo motivo, Deep Research segna un passo significativo verso il nostro obiettivo più ampio di sviluppare l’AGI”

L’IA agenziale consente a ChatGPT di assistere le ricerche più complesse

Deep Research consente a ChatGPT di trovare, analizzare e sintetizzare autonomamente le informazioni provenienti da centinaia di fonti online. Secondo OpenAI, con una semplice richiesta da parte dell’utente, lo strumento è in grado di fornire un rapporto completo, paragonabile ai risultati di un analista di ricerca.

Attingendo le funzionalità da una variante del modello “o3” di OpenAI, l’obiettivo è quello di liberare gli utenti dalla raccolta di informazioni che richiede tempo e lavoro. Che si tratti di un’analisi competitiva delle piattaforme di streaming, di un’analisi politica informata o persino di raccomandazioni personalizzate per una nuova bicicletta da pendolare, Deep Research promette risultati precisi e affidabili.

Inoltre, ogni risultato include citazioni complete e una documentazione trasparente che consente agli utenti di verificare i risultati con facilità.

Lo strumento sembra particolarmente abile nello scoprire intuizioni di nicchia o non intuitive, il che lo rende una risorsa preziosa in settori come la finanza, la scienza, la politica e l’ingegneria. Ma OpenAI immagina che Deep Research possa essere utile anche per l’utente medio, ad esempio per gli acquirenti che cercano consigli iper-personalizzati o un prodotto specifico.

le persone pubblicheranno molti esempi fantastici, ma eccone uno divertente:

in questo momento sono in Giappone e sto cercando una vecchia NSX. ho passato ore a cercare senza successo quella perfetta. stavo per arrendermi e la deep research l’ha trovata.

– Sam Altman (@sama) 3 febbraio 2025

Quest’ultima funzionalità agenziale funziona attraverso l’interfaccia utente di ChatGPT; gli utenti devono semplicemente selezionare l’opzione “Ricerca profonda” nel compositore di messaggi e digitare la loro domanda. È inoltre possibile caricare file di supporto o fogli di calcolo per creare un contesto aggiuntivo.

Una volta avviata, l’intelligenza artificiale intraprende un rigoroso processo in più fasi, che può richiedere 5-30 minuti per essere completato. Una barra laterale fornisce aggiornamenti sulle azioni intraprese e sulle fonti consultate. Gli utenti possono continuare a svolgere altre attività e riceveranno una notifica quando il report finale sarà pronto.

I risultati vengono presentati nella chat sotto forma di rapporti dettagliati e ben documentati. Nelle prossime settimane, OpenAI ha in programma di migliorare ulteriormente questi risultati incorporando immagini, visualizzazioni di dati e grafici per offrire ancora più chiarezza e contesto.

A differenza di GPT-4o – che eccelle nelle conversazioni multimodali in tempo reale – Deep Research privilegia la profondità e il dettaglio. La sua capacità di citare rigorosamente le fonti e di fornire un’analisi completa la distingue, spostando l’attenzione da risposte veloci e sintetiche a approfondimenti ben documentati e di qualità.

Costruito per le sfide del mondo reale

Deep Rsearch si avvale di metodologie di formazione sofisticate, basate su attività di navigazione e ragionamento reali in diversi ambiti. Il suo modello è stato addestrato tramite l’apprendimento per rinforzo per pianificare ed eseguire autonomamente processi di ricerca in più fasi, compreso il backtracking e l’affinamento adattivo del suo approccio quando si rendono disponibili nuove informazioni.

Lo strumento è in grado di sfogliare i file caricati dall’utente, di generare e iterare grafici utilizzando Python, di incorporare nelle risposte contenuti multimediali come immagini e pagine web generate e di citare frasi o passaggi esatti delle sue fonti. Il risultato di questa lunga formazione è un agente altamente capace di affrontare i complessi problemi del mondo reale.

OpenAI ha valutato Deep Research attraverso un’ampia serie di esami di livello esperto noti come “L’ultimo esame dell’umanità”. Gli esami – che comprendono oltre 3.000 domande che spaziano dalla missilistica alla linguistica, dall’ecologia ai classici – mettono alla prova la competenza di un’intelligenza artificiale nel risolvere problemi di varia natura.

I risultati sono stati impressionanti: il modello ha raggiunto un’accuratezza record del 26,6% in tutti questi ambiti:

GPT-4o: 3.3%
Grok-2: 3,8%
Claude 3.5 Sonnet: 4.3%
OpenAI o1: 9,1%
DeepSeek-R1: 9,4%
Ricerca profonda: 26.6% (con strumenti Python di navigazione)

Deep Research ha anche raggiunto una nuova performance all’avanguardia nel benchmark GAIA, che valuta i modelli di IA su domande del mondo reale che richiedono capacità di ragionamento, fluidità multimodale e abilità nell’uso degli strumenti. Deep Research ha raggiunto la vetta della classifica con un punteggio del 72,57%.

Limiti e sfide

Sebbene la capacità dell’intelligenza artificiale agenziale di Deep Research in ChatGPT rappresenti un coraggioso passo avanti, OpenAI riconosce che la tecnologia è ancora nelle sue fasi iniziali e presenta dei limiti.

Secondo OpenAI, il sistema occasionalmente “allucina” i fatti o offre inferenze errate, anche se a un tasso notevolmente ridotto rispetto ai modelli GPT esistenti. Inoltre, deve fare i conti con la difficoltà di distinguere tra fonti autorevoli e contenuti speculativi e fatica a calibrare i suoi livelli di fiducia, mostrando spesso un’eccessiva sicurezza per risultati potenzialmente incerti.

Anche piccoli errori di formattazione nei rapporti e nelle citazioni, così come ritardi nell’avvio delle attività, potrebbero frustrare gli utenti iniziali. OpenAI afferma che questi problemi dovrebbero migliorare con il tempo, grazie a un maggiore utilizzo e a perfezionamenti iterativi.

OpenAI sta introducendo la funzionalità gradualmente, a partire dagli utenti Pro, che avranno accesso a un massimo di 100 query al mese. Seguiranno i livelli Plus e Team, mentre l’accesso Enterprise arriverà successivamente.

I residenti nel Regno Unito, in Svizzera e nello Spazio Economico Europeo non sono ancora in grado di accedere a questa funzione, ma OpenAI afferma che sta lavorando per estendere il rollout a queste regioni.

Nelle prossime settimane, OpenAI espanderà la funzione alle piattaforme mobile e desktop di ChatGPT. La visione a lungo termine prevede la possibilità di collegarsi a fonti di dati proprietarie o basate su abbonamento, migliorando ulteriormente la solidità e la personalizzazione dei risultati.

In prospettiva, OpenAI prevede di integrare Deep Research con “Operator”, un chatbot già esistente che compie azioni nel mondo reale. Questa integrazione consentirebbe a ChatGPT di gestire senza problemi compiti che richiedono sia una ricerca online asincrona che un’esecuzione nel mondo reale.

Leggi di più su www.artificialintelligence-news.com