L’evoluzione delle applicazioni di intelligenza artificiale comporta una maggiore richiesta di infrastrutture di rete, soprattutto in termini di latenza e connettività.
Il supporto di implementazioni di IA su larga scala introduce nuovi problemi e gli analisti prevedono che il traffico legato all’IA rappresenterà presto una parte importante del traffico di rete totale. Il settore deve essere pronto a gestire questa ondata in modo efficace. F5 sta adattando le sue soluzioni per gestire la complessità dei carichi di lavoro dell’intelligenza artificiale e la sua tecnologia ora include l’elaborazione in tempo reale di dati multimodali.
L’intelligenza artificiale presenta sia opportunità che rischi nel campo della sicurezza, in quanto è in grado di migliorare la protezione e allo stesso tempo di consentire le minacce informatiche guidate dall’intelligenza artificiale. La collaborazione tra hyperscaler, telco e aziende tecnologiche è fondamentale per creare reti ottimizzate per l’AI. La collaborazione e l’innovazione continuano a cambiare il panorama delle reti AI e F5 è impegnata a promuovere i progressi in questo settore.
In vista dell’AI & Big Data Expo Europe, Kunal Anand, Chief Technology and AI Officer di F5, illustra il ruolo e le iniziative dell’azienda per rimanere all’avanguardia nelle soluzioni di rete abilitate all’AI.
Notizie sull’AI: Con l’evoluzione delle applicazioni AI, le esigenze dell’infrastruttura di rete diventano sempre più complesse. Quali sono le sfide principali che il settore deve affrontare in termini di latenza e connettività per supportare le implementazioni di AI su larga scala?
Anand: F5 ha scoperto che l’IA ha trasformato drasticamente le architetture delle applicazioni. Alcune aziende stanno investendo miliardi di dollari in fabbriche di IA – cluster di GPU enormi – mentre altre preferiscono soluzioni basate sul cloud o piccoli modelli linguistici (SLM) come alternative meno costose.
Le architetture di rete si stanno evolvendo per affrontare queste sfide. Le fabbriche di AI operano su stack di rete distinti, come InfiniBand con GPU specifiche come le H100 o la prossima serie Blackwell di NVIDIA. Allo stesso tempo, le tecnologie basate sul cloud e i cloud di GPU stanno avanzando.
Una tendenza importante è quella della gravità dei dati, in cui i dati delle organizzazioni sono bloccati in ambienti specifici. Questo ha spinto l’evoluzione delle architetture multi-cloud, che consentono ai carichi di lavoro di collegarsi con i dati attraverso gli ambienti per la generazione aumentata del reperimento (RAG).
Con l’aumento delle richieste di RAG, le organizzazioni si trovano ad affrontare una latenza maggiore a causa delle risorse limitate, sia che si tratti di archivi di dati molto utilizzati o di set limitati di server GPU.
Notizie sull’AI: Gli analisti prevedono che il traffico legato all’intelligenza artificiale costituirà presto una parte significativa del traffico di rete. Quali sfide particolari pone questo afflusso di traffico generato dall’intelligenza artificiale all’infrastruttura di rete esistente e come pensi che il settore si stia preparando?
Anand: F5 ritiene che entro la fine del decennio la maggior parte delle applicazioni sarà alimentata o guidata dall’intelligenza artificiale, rendendo necessario un aumento della catena dei servizi di rete. Queste applicazioni utilizzeranno le API per comunicare con le fabbriche di AI e i servizi di terze parti, per accedere ai dati per la RAG e potenzialmente per esporre le proprie API. In sostanza, le API saranno il collante che terrà insieme questo ecosistema, come suggerito dagli analisti.
In prospettiva, si prevede che il traffico legato all’intelligenza artificiale dominerà il traffico di rete, poiché l’intelligenza artificiale sarà sempre più integrata nelle applicazioni e nelle API. Poiché l’IA diventa centrale in quasi tutte le applicazioni, il traffico legato all’IA aumenterà naturalmente.
Notizie sull’AI: Con le applicazioni AI che diventano sempre più complesse e che elaborano dati multimodali in tempo reale, in che modo F5 sta adattando le sue soluzioni per garantire che le reti possano gestire in modo efficiente questi carichi di lavoro dinamici?
Anand: F5 guarda a questo aspetto da molti punti di vista. Nel caso di RAG, quando i dati – che siano immagini, flussi binari o testo – devono essere recuperati da uno storage di dati, il metodo è lo stesso indipendentemente dal formato dei dati. I clienti spesso desiderano un rapido bilanciamento del carico Layer 4, la gestione del traffico e le capacità di gestione, tutte caratteristiche in cui F5 eccelle. L’azienda fornisce alle organizzazioni servizi di bilanciamento del carico, gestione del traffico e sicurezza, garantendo a RAG un accesso efficiente ai dati. F5 ha anche abilitato il bilanciamento del carico tra le fabbriche di AI.
In alcuni casi, le grandi organizzazioni gestiscono cluster di GPU enormi con decine di migliaia di GPU. Poiché i carichi di lavoro dell’AI sono imprevedibili, queste GPU possono essere disponibili o non disponibili a seconda del carico di lavoro. F5 garantisce un instradamento efficiente del traffico, mitigando l’imprevedibilità dei carichi di lavoro AI.
F5 migliora le prestazioni, aumenta il throughput e aggiunge funzionalità di sicurezza per le organizzazioni che costruiscono fabbriche e cluster di AI.
Notizie sull’AI: Poiché l’IA migliora la sicurezza e allo stesso tempo pone delle minacce informatiche basate sull’IA, quali approcci sta adottando F5 per rafforzare la sicurezza e la resilienza della rete contro queste sfide in continua evoluzione?
Anand: Ci sono molte sfide diverse legate all’AI in arrivo. Gli aggressori stanno già utilizzando l’intelligenza artificiale per generare nuovi payload, trovare scappatoie e lanciare attacchi unici. Ad esempio, ChatGPT e i trasformatori visivi hanno la capacità di rompere i CAPTCHA, soprattutto quelli interattivi. Le dimostrazioni recenti hanno mostrato la sofisticazione di questi attacchi.
Come già visto in passato, ogni volta che gli aggressori ottengono un vantaggio con una nuova tecnologia, i difensori devono raccogliere la sfida. Questo spesso richiede la riconsiderazione dei modelli di sicurezza, come il passaggio da “permetti tutto, nega alcuni” a “permetti alcuni, nega tutto” Molte organizzazioni stanno esplorando soluzioni per combattere le minacce guidate dall’intelligenza artificiale.
F5 sta facendo grandi investimenti per stare al passo con le minacce guidate dall’intelligenza artificiale. Nell’ambito del suo programma di intelligence F5, l’azienda sta sviluppando, addestrando e distribuendo modelli che sono supportati dal suo AI Center of Excellence.
All’inizio di quest’anno, F5 ha lanciato un AI data fabric, con un team dedicato allo sviluppo di modelli che servano l’intera azienda, dalla creazione di policy alla fornitura di insight. F5 ritiene di essere in una posizione ottimale per affrontare questi problemi in crescita.
AI News: Che ruolo hanno le partnership nello sviluppo della prossima generazione di reti ottimizzate per l’AI, in particolare tra hyperscaler, telco e aziende tecnologiche?
Anand: Le partnership sono importanti per lo sviluppo dell’IA. Lo stack dell’IA è complesso e coinvolge diversi componenti, tra cui elettricità, data center, hardware, server, GPU, memoria, potenza di calcolo e stack di rete, che devono funzionare tutti insieme. È insolito che un’unica organizzazione possa supervisionare tutto dall’inizio alla fine.
F5 si concentra sulla creazione e sul mantenimento delle partnership necessarie in materia di calcolo, networking e storage per supportare l’IA.
AI News: Come vede F5 il suo ruolo nell’avanzamento dell’AI networking e su quali iniziative si sta concentrando per rimanere all’avanguardia nelle soluzioni di networking abilitate all’AI?
Anand: F5 è impegnata nello sviluppo della sua piattaforma tecnologica. L’AI Data Fabric, lanciato all’inizio di quest’anno, lavorerà con l’AI Center of Excellence per preparare l’organizzazione al futuro.
F5 sta inoltre stringendo solide collaborazioni, che verranno annunciate prossimamente. L’azienda è entusiasta del suo lavoro e del rapido ritmo del cambiamento globale. Il punto di vista unico di F5, che elabora il traffico mondiale, le consente di mettere in relazione i dati con le tendenze del settore. F5 intende inoltre essere più aperta nei confronti della sua ricerca e dei suoi modelli, con alcuni contributi open-source in arrivo.
Nel complesso, F5 è incredibilmente ottimista sul futuro. L’impatto trasformativo dell’IA è notevole ed è un momento emozionante per partecipare a questo cambiamento.



