MediaTech
Google presenta Gemini, il modello di Intelligenza Artificiale più potente
Google potenzia il motore della sua IA generativa, che con Gemini fa un grande passo in avanti verso i ragionamenti degli esseri umani
Google presenta Gemini, il modello di intelligenza artificiale più potente. Ecco di cosa si tratta
Annunciato alla conferenza degli sviluppatori I/O a maggio Google ha finalmente presentato Gemini, il primo modello di intelligenza artificiale multimodale cioè è in grado di comprendere e operare su diversi tipi di informazioni, tra cui testo, codice, audio, immagini e video. Si aspettava da tempo una risposta vera a ChatGpt e all’Ai Gen da parte dell’azienda che ha inventato i trasformer ed è arrivata. In una nota nel blogpost gli scienziati di Mountain View scrivono che è anche il modello più flessibile di Google AI, in grado di funzionare su qualsiasi dispositivo, dai data center ai dispositivi mobili. Si presenta in tre versioni: Gemini Ultra, il modello più grande e in grado di eseguire compiti altamente complessi. Gemini Pro che entrerà dentro in Bard e nel motore di ricerca e Gemini Nano che è il modello più efficiente in grado di lavorare anche negli smartphone a partire dalla famiglia Pixel. Quello Ultra, il più potente, secondo quanto emerge da una tabella ha prestazioni superiori a quelle di Gpt-4.
GUARDA LA PRESENTAZIONE DI "GEMINI"
LEGGI ANCHE: Il 59% delle aziende utilizza l'intelligenza artificiale
LEGGI ANCHE: Google, accordo con gli editori in Canada. 68 milioni per l'uso delle news
Gemini, l’IA più potente di Google: ecco cosa sa fare di nuovo
Gemini si affida all’apprendimento automatico “per rinforzo”. Cioè a un sistema di premio e punizioni per insegnare come comportarsi a seconda delle situazioni in ambito AI generativa. Questo modello è stato addestrato a riconoscere e comprendere testo, immagini, audio e altro ancora simultaneamente, in modo da comprendere meglio le informazioni sfumate e rispondere alle domande relative a argomenti complessi. Questo, scrive Google, lo rende particolarmente bravo a spiegare il ragionamento in soggetti complessi come la matematica e la fisica. Le demo mostrate svelano una capacità di ragionamento multimodale vuole dire che riesce a dare senso a informazioni scritte e visive complesse. Per esempio è in grado di contestualizzare quello che vede e rispondere alle domande relative a argomenti complicati. Ciò lo rende particolarmente bravo a spiegare il ragionamento in soggetti complessi come la matematica e la fisica.
Gemini, l’IA più potente di Google: ecco come è stato realizzato
Gemini è stato addestrato su una generazione di accelleratori proprietari Tensor Processing Units (TPUs) V4 e v5 che Google ha definito più potenti, scalabili ed efficienti. Insieme a Cloud TPU v5p, progettato per l’addestramento di modelli di intelligenza artificiale all’avanguardia questa nuova generazione di TPU annunciata oggi «accelererà lo sviluppo di Gemini e aiuterà gli sviluppatori e i clienti aziendali ad addestrare modelli di intelligenza artificiale generativa su larga scala più velocemente». il sistema risponde ai principi di Ai responsabile di Google e ha valutazioni di sicurezza più complete di qualsiasi modello di intelligenza artificiale realizzati a Mountain View fino ad oggi, comprese quelle per i pregiudizi e la tossicità. Google utilizza benchmark come Real Toxicity Prompts, un set di 100.000 prompt con vari gradi di tossicità estratti dal web, sviluppato da esperti dell’Allen Institute of AI.
Gemini dispone delle valutazioni di sicurezza più complete di qualsiasi modello di intelligenza artificiale di Google fino ad oggi, anche per quanto riguarda pregiudizi impliciti (bias) e tossicità. Google ha condotto nuove ricerche su potenziali aree di rischio come i reati informatici, la manipolazione e l'autonomia di scelta, e sta applicando le migliori tecniche di adversarial testing di Google Research per identificare i problemi critici di sicurezza prima di rendere Gemini disponibile.
Gemini, l’IA più potente di Google: ecco cosa succede ora
Nelle prossime settimane, Gemini sarà disponibile in altri prodotti e servizi di Google come Search, Ads, Chrome e Duet AI. A partire dal 13 dicembre, sviluppatori e aziende potranno accedere a Gemini Pro tramite l’API Gemini in Google AI Studio o Google Cloud Vertex AI. Gli sviluppatori Android potranno anche lavorare con Gemini Nano, il modello più efficiente di Google per le attività sul dispositivo, tramite AICore, una nuova capacità di sistema disponibile in Android 14, a partire dai dispositivi Pixel 8 Pro. Android 14. Ci vorrà invece più tempo per Gemini Ultra, Quanto a Bard all’inizio del prossimo anno nascerà una sua versione più avanzata - Bard Advanced - che darà accesso anche a Gemini Ultra.