Il misterioso “gpt2-chatbot”: una scoperta a sorpresa nell’AI?

Un misterioso chatbot chiamato “gpt2-chatbot” ha suscitato un’immensa eccitazione e speculazione nella comunità dell’intelligenza artificiale.

Questo chatbot, che puoi trovare e sperimentare tu stesso sulla Chatbot Arena di LMSys, secondo alcuni utenti è più avanzato degli attuali modelli all’avanguardia come GPT-4 e Claude 3 Opus.

Emerso apparentemente dal nulla, le sue origini sono del tutto sconosciute. Potrebbe trattarsi di un progetto sperimentale di un importante laboratorio di AI o di una strana fuga di notizie?

Esiste un nuovo misterioso modello chiamato gpt2-chatbot accessibile da un importante sito di benchmarking LLM. Nessuno sa chi l’abbia creato o cosa sia, ma io ci ho giocato un po’ e sembra che abbia lo stesso livello di abilità approssimativo del GPT-4. Un misterioso modello di classe GPT-4? Fantastico! pic.twitter.com/1s2iEreaiT

– Ethan Mollick (@emollick) 29 aprile 2024

Gli utenti di Reddit pensano principalmente che si tratti di OpenAI poiché il modello ammette che lo stile e il tono delle risposte sembrano diversi da quelli di GPT-4 e GPT-4 Turbo, ma il taglio delle conoscenze differisce dai modelli OpenAI attualmente disponibili.

gpt2-chatbot è bravissimo nell’ascii art, molto più di qualsiasi altro modello pic.twitter.com/1IwEaJyU7Q

– Phil (@phill__1) 29 aprile 2024

Ho chiesto io stesso a gpt2-chatbot: “Chi sei?”, e lui ha risposto:

“Sono stato creato da OpenAI, un’organizzazione di ricerca che si occupa dello sviluppo e della promozione di IA amichevoli per il bene dell’umanità. Il mio sviluppo si basa sulla serie di modelli linguistici GPT (Generative Pre-trained Transformer), in particolare sulla versione GPT-4, che è un’evoluzione dei modelli precedenti come il GPT-3. Questi modelli vengono addestrati su una vasta gamma di testi internet, ma sono progettati per generare testi simili a quelli umani in base alle richieste che ricevono.

OpenAI l’azienda è nata con l’obiettivo di garantire che l’intelligenza artificiale generale (AGI) vada a beneficio di tutta l’umanità. Conduce ricerche nel campo dell’IA con l’obiettivo di sviluppare e indirizzare le tecnologie di intelligenza artificiale in modo da apportare benefici all’umanità nel suo complesso, senza essere vincolata da obblighi finanziari nei confronti degli investitori.

Se hai altre domande sull’IA, su OpenAI o sulle tecnologie correlate, non esitare a chiedere!”

Quando gli ho chiesto perché si chiama gpt2-chatbot, mi ha risposto:

“Per riassumere, non mi chiamo “GPT-2”; sono una variante di GPT-4, progettata specificamente per applicazioni interattive, come questo formato di conversazione. Il mio progetto include miglioramenti nella gestione dei dialoghi, nelle caratteristiche di sicurezza, nelle considerazioni etiche e nella qualità generale delle risposte. Se vedi riferimenti a “GPT-2″, probabilmente si tratta del modello precedente a GPT-3 e GPT-4”

le prestazioni del gpt2-chatbot provocano speculazioni

Per quanto riguarda le prestazioni, un utente del forum di Y Combinator ha parlato della conoscenza del dominio del bot nel campo della scienza dei materiali, discutendo della produzione di pale di turbine con una profondità che non avrebbe visto altrimenti.

Un altro utente, il noto scienziato dei dati Simon Wilson, è rimasto impressionato dalla gestione di query altamente personalizzate, suggerendo che il bot ha una comprensione dettagliata del background personale delle persone.

Puoi provare il misterioso gpt2-chatbot su https://t.co/4ARf9G6RHb (seleziona “Direct Chat” e sceglilo dal menu)

Impressioni iniziali: Sono molto colpito. Mi ha dato una risposta migliore per una ricerca sull’ego (“Chi è Simon Willison?”) rispetto a qualsiasi altro modello che ho provato https://t.co/MCJMVhNs8k

– Simon Willison (@simonw) 29 aprile 2024

Altri hanno individuato i difetti standard di LLM, come allucinazioni e imprecisioni.

Avendolo usato io stesso, concordo sul fatto che sembra una variante del GPT-4.

Per quanto riguarda la possibilità che sia migliore di GPT-4, come ipotizzato da alcuni, vale la pena sottolineare che molti ritengono che le prestazioni di GPT-4 siano diminuite nel tempo (forse in concomitanza con il fatto che OpenAI ha dedicato risorse di calcolo all’addestramento di nuovi modelli).

Quindi, questa variante potenzialmente non adulterata potrebbe sembrare come la GPT-4 quando è uscita per la prima volta. Se a ciò si aggiungono alcune lievi differenze nel comportamento e nelle prestazioni su compiti specifici, si capisce perché le speculazioni siano elevate.

Quando le discussioni su gpt2-chatbot hanno raggiunto X, alcuni hanno inevitabilmente ipotizzato che si tratti di una prova di GPT-4.5, GPT-5 o addirittura AGI. Tuttavia, molti non sono sicuri che rappresenti un progresso concreto rispetto ai modelli attuali.

In generale, è impossibile che un’azienda di intelligenza artificiale addestri un chatbot completamente nuovo come questo e lo rilasci in questo modo. Si tratta quasi certamente di una variante GPT-4.

In definitiva, si tratta di dicerie finché il creatore non esce da dietro le quinte e ne rivendica la proprietà.

Leggi di più su dailyai.com