ai marketing italia

la prima agenzia dedicata a far crescere la tua pmi con l'intelligenza artificiale

Claude 3.5 Sonnet di Anthropic batte GPT-4o nella maggior parte dei benchmark

Anthropic ha lanciato Claude 3.5 Sonnet, il suo modello di fascia media che supera la concorrenza e persino l’attuale Claude 3 Opus, il modello di punta di Anthropic, in diverse valutazioni.

Claude 3.5 Sonnet è ora accessibile gratuitamente su Claude.ai e sull’app Claude iOS, con limiti tariffari più elevati per gli abbonati ai piani Claude Pro e Team. È disponibile anche attraverso Anthropic API, Amazon Bedrock e Vertex AI di Google Cloud. Il prezzo del modello è di 3 dollari per milione di token in ingresso e 15 dollari per milione di token in uscita, con una finestra contestuale di 200.000 token.

Anthropic sostiene che Claude 3.5 Sonnet “stabilisce nuovi parametri di riferimento nel settore per quanto riguarda il ragionamento a livello di laurea (GPQA), la conoscenza a livello di laurea (MMLU) e la competenza di codifica (HumanEval)” Il modello dimostra di essere in grado di comprendere meglio le sfumature, l’umorismo e le istruzioni complesse, eccellendo nella produzione di contenuti di alta qualità con un tono naturale.

Operando a una velocità doppia rispetto a Claude 3 Opus, Claude 3.5 Sonnet è adatto a compiti complessi come l’assistenza clienti sensibile al contesto e l’orchestrazione di flussi di lavoro in più fasi. In una valutazione interna di codifica agenziale, ha risolto il 64% dei problemi, superando in modo significativo Claude 3 Opus che ha raggiunto il 38%.

Il modello dimostra anche di aver migliorato le capacità di visione, superando Claude 3 Opus nei benchmark di visione standard. Questo miglioramento è particolarmente evidente nei compiti che richiedono un ragionamento visivo, come l’interpretazione di grafici e diagrammi. Claude 3.5 Sonnet è in grado di trascrivere accuratamente il testo da immagini imperfette, una caratteristica preziosa per settori come la vendita al dettaglio, la logistica e i servizi finanziari.

Claude 3.5 Sonnet di Anthropic batte GPT-4o nella maggior parte dei benchmark

Oltre al lancio del modello, Anthropic ha presentato Artifacts on Claude.ai, una nuova funzione che migliora l’interazione degli utenti con l’IA. Questa funzione consente agli utenti di visualizzare, modificare e sviluppare i contenuti generati da Claude in tempo reale, creando un ambiente di lavoro più collaborativo.

Nonostante il significativo salto di intelligenza, Claude 3.5 Sonnet mantiene l’impegno di Anthropic per la sicurezza e la privacy. L’azienda dichiara: “I nostri modelli sono sottoposti a test rigorosi e sono stati addestrati per ridurre gli abusi”

Esperti esterni, tra cui l’Istituto britannico per la sicurezza dell’AI (UK AISI) e gli esperti di sicurezza dei bambini di Thorn, hanno partecipato ai test e al perfezionamento dei meccanismi di sicurezza del modello.

Anthropic sottolinea la sua dedizione alla privacy degli utenti, affermando: “Non addestriamo i nostri modelli generativi sui dati inviati dagli utenti, a meno che questi non ci diano il permesso esplicito di farlo. Ad oggi non abbiamo utilizzato dati inviati da clienti o utenti per addestrare i nostri modelli generativi”

In prospettiva, Anthropic prevede di rilasciare Claude 3.5 Haiku e Claude 3.5 Opus più avanti nel corso dell’anno per completare la famiglia di modelli Claude 3.5. L’azienda sta inoltre sviluppando nuove modalità e funzionalità per supportare un maggior numero di casi d’uso aziendali, tra cui l’integrazione con le applicazioni aziendali e una funzione di memoria per un’esperienza utente più personalizzata.

Leggi di più su www.artificialintelligence-news.com