Google ha rilasciato oggi il suo modello Gemini 3 Flash, veloce ed economico, basato sul Gemini 3 lanciato lo scorso mese, con l'obiettivo di rubare la scena a OpenAI. L'azienda sta anche rendendo questo modello quello predefinito nell'app Gemini e nella modalità AI nella ricerca.
Il nuovo modello Flash arriva sei mesi dopo l'annuncio da parte di Google del modello Gemini 2.5 Flash, offrendo miglioramenti significativi. Nei benchmark, il modello Gemini 3 Flash supera di gran lunga il suo predecessore e, in alcune misurazioni, eguaglia le prestazioni di altri modelli di frontiera come Gemini 3 Pro e GPT 5.2.
Ad esempio, ha ottenuto un punteggio del 33,7% senza l'uso di strumenti nel benchmark Humanity’s Last Exam, progettato per testare la competenza in diversi ambiti. In confronto, Gemini 3 Pro ha ottenuto il 37,5%, Gemini 2.5 Flash l'11% e il nuovo GPT-5.2 il 34,5%.
Nel benchmark di multimodalità e ragionamento MMMU-Pro, il nuovo modello ha superato tutti i concorrenti con un punteggio dell'81,2%.
Distribuzione ai consumatori
Google sta rendendo Gemini 3 Flash il modello predefinito nell'app Gemini a livello globale, sostituendo Gemini 2.5 Flash. Gli utenti possono comunque scegliere il modello Pro dal selettore di modelli per domande di matematica e programmazione.
L'azienda afferma che il nuovo modello è abile nell'identificare contenuti multimodali e nel fornire una risposta basata su questi. Ad esempio, puoi caricare un breve video di pickleball e chiedere consigli; puoi provare a disegnare uno schizzo e far indovinare al modello cosa stai disegnando; oppure puoi caricare una registrazione audio per ottenere un'analisi o generare un quiz.
L'azienda ha anche dichiarato che il modello comprende meglio l'intento delle query degli utenti e può generare risposte più visive con elementi come immagini e tabelle.
Unisciti alla lista d'attesa per Disrupt 2026
Aggiungiti alla lista d'attesa per Disrupt 2026 per essere tra i primi quando saranno disponibili i biglietti Early Bird. I precedenti Disrupt hanno portato Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil e Vinod Khosla sul palco — parte di oltre 250 leader del settore che guidano più di 200 sessioni pensate per alimentare la tua crescita e affinare il tuo vantaggio. Inoltre, incontra centinaia di startup innovative in ogni settore.
Unisciti alla lista d'attesa per Disrupt 2026
Aggiungiti alla lista d'attesa per Disrupt 2026 per essere tra i primi quando saranno disponibili i biglietti Early Bird. I precedenti Disrupt hanno portato Google Cloud, Netflix, Microsoft, Box, Phia, a16z, ElevenLabs, Wayve, Hugging Face, Elad Gil e Vinod Khosla sul palco — parte di oltre 250 leader del settore che guidano più di 200 sessioni pensate per alimentare la tua crescita e affinare il tuo vantaggio. Inoltre, incontra centinaia di startup innovative in ogni settore.
Puoi anche utilizzare il nuovo modello per creare prototipi di app nell'app Gemini utilizzando i prompt.
Il Gemini 3 Pro è ora disponibile per tutti negli Stati Uniti per la ricerca e più persone negli Stati Uniti possono accedere anche al modello di immagini Nano Banana Pro nella ricerca.
Disponibilità per aziende e sviluppatori
Google ha osservato che aziende come JetBrains, Figma, Cursor, Harvey e Latitude stanno già utilizzando il modello Gemini 3 Flash, disponibile tramite Vertex AI e Gemini Enterprise.
Per gli sviluppatori, l'azienda rende il modello disponibile in anteprima tramite API e in Antigravity, il nuovo strumento di programmazione di Google rilasciato lo scorso mese.
L'azienda ha dichiarato che Gemini 3 Pro ottiene il 78% nel benchmark di programmazione SWE-bench verified, superato solo da GPT-5.2. Ha aggiunto che il modello è ideale per l'analisi video, l'estrazione di dati e Q&A visivi, e grazie alla sua velocità, è adatto a flussi di lavoro rapidi e ripetibili.
Image Credits: Google Il prezzo del modello è di $0,50 per 1 milione di token in input e $3,00 per 1 milione di token in output. Questo è leggermente più costoso rispetto ai $0,30 per 1 milione di token in input e $2,50 per 1 milione di token in output di Gemini Flash 2.5. Ma Google afferma che il nuovo modello supera il modello Gemini 2.5 Pro pur essendo tre volte più veloce. E, per i compiti di ragionamento, utilizza in media il 30% di token in meno rispetto al 2.5 Pro. Ciò significa che, complessivamente, potresti risparmiare sul numero di token per determinati compiti.
Image Credits: Google “Noi posizioniamo davvero Flash come il tuo modello da lavoro. Quindi, se guardi, ad esempio, anche solo i prezzi di input e output in cima a questa tabella, Flash è semplicemente un'offerta molto più economica dal punto di vista del prezzo di input e output. E quindi consente, per molte aziende, compiti in massa,” ha detto Tulsee Doshi, Senior Director & Head of Product per i modelli Gemini, a TechCrunch in un briefing.
Da quando ha rilasciato Gemini 3, Google ha elaborato oltre 1 trilione di token al giorno tramite la sua API, nel mezzo della feroce guerra di rilascio e prestazioni con OpenAI.
All'inizio di questo mese, Sam Altman avrebbe inviato un memo interno “Code Red” al team di OpenAI dopo che il traffico di ChatGPT era diminuito mentre la quota di mercato di Google tra i consumatori aumentava. Successivamente, OpenAI ha rilasciato GPT-5.2 e un nuovo modello di generazione di immagini. OpenAI ha anche vantato la crescente adozione aziendale e ha dichiarato che il volume dei messaggi ChatGPT è cresciuto di 8 volte da novembre 2024.
Sebbene Google non abbia affrontato direttamente la concorrenza con OpenAI, ha dichiarato che il rilascio di nuovi modelli sta spingendo tutte le aziende a essere attive.
“Quello che sta succedendo nel settore è che tutti questi modelli continuano a essere straordinari, si sfidano a vicenda, spingono il confine. E penso che sia anche fantastico vedere le aziende che rilasciano questi modelli,” ha detto Doshi.
“Stiamo anche introducendo nuovi benchmark e nuovi modi di valutare questi modelli. E questo ci sta anche incoraggiando.”
