Google lancia Nano Banana 2 Lite e Gemini Omni Flash: immagini in 4 secondi e video editabili a parole

Wait 5 sec.

Google ha appena rilasciato due nuovi modelli AI per sviluppatori e consumatori: Nano Banana 2 Lite, il modello di generazione immagini più veloce ed economico della famiglia Nano Banana, e Gemini Omni Flash, pensato per la generazione e l'editing di video. Entrambi sono disponibili già oggi su Google AI Studio e tramite le API Gemini, e stanno arrivando anche su superfici consumer come la Ricerca Google, l'app Gemini e altri prodotti Google. Nano Banana 2 Lite (identificato internamente come gemini-3.1-flash-lite-image) è progettato per chi ha bisogno di generare immagini in grandi volumi e con latenza minima. Il dato più rilevante è la velocità: 4 secondi per produrre un'immagine da testo, il che lo rende adatto alla prototipazione rapida e ai flussi di lavoro ad alto ritmo.Sul fronte dei costi, il prezzo è di 0,034 dollari per 1.000 immagini a risoluzione 1K: un valore pensato per chi deve gestire budget operativi o volumi elevati. Nonostante la priorità alla velocità, Google dichiara che il modello mantiene una buona aderenza ai prompt, coerenza dei personaggi e testo leggibile all'interno delle immagini.Nano Banana 2 Lite è il sostituto consigliato per chi usava la prima versione di Nano Banana (gemini-2.5-flash-image): secondo Google, uno swap diretto porta benefici immediati su qualità, velocità e costi. Per contestualizzare, la famiglia si articola così:Nano Banana 2 Lite: massima velocità, bassa latenza, volumi altiNano Banana 2: bilanciamento tra qualità e costo, uso generaleNano Banana Pro: uso professionale complesso, massima precisioneNano Banana (legacy): da aggiornare, non più raccomandatoOltre agli sviluppatori, Nano Banana 2 Lite sta arrivando su AI Mode nella Ricerca, NotebookLM, Google Photos, Stitch, Google Flow e Google Ads. Gemini Omni Flash (gemini-omni-flash-preview) era stato annunciato al Google I/O e oggi arriva ufficialmente agli sviluppatori tramite API. Il modello supporta la generazione di video da testo, immagini e video in input, e permette di modificare i filmati tramite istruzioni in linguaggio naturale, il che è la parte più interessante per chi lavora con contenuti multimediali.Le capacità principali includono:Editing conversazionale: si modifica il video descrivendo a parole cosa si vuole cambiareReferencing multimodale: si combinano immagini, testo e video per mantenere coerenza visivaConoscenza del mondo reale: il modello attinge alle conoscenze di Gemini per costruire narrative credibiliSincronizzazione testo-azione: testi e grafiche si collegano direttamente alle azioni nel videoIl prezzo è di 0,10 dollari al secondo di video generato, in linea con Veo 3.1 Fast. Ci sono però limitazioni importanti da conoscere: le generazioni sono attualmente limitate a 10 secondi, non è ancora supportato l'upload di riferimenti audio, i video di riferimento fino a 3 secondi vengono accettati dallo schema API ma non elaborati correttamente, e la coerenza dei personaggi nelle transizioni di scena è ancora imprecisa. Google dichiara di stare lavorando su questi punti.La vera proposta di valore che Google vuole comunicare è la catena tra i due modelli: si genera un'immagine con Nano Banana 2 Lite (veloce ed economico), poi la si passa a Omni Flash per animarla in un video. Tramite l'Interactions API è possibile mantenere la cronologia della sessione e impilare fino a tre modifiche sequenziali. Google ha già pubblicato alcune app demo per mostrare questo workflow: una per teletrasportarsi in luoghi iconici partendo da un selfie, una per il design d'interni, una per creare video di prodotto in stile e-commerce.Entrambi i modelli usano il watermarking SynthID di Google e il contenuto generato è verificabile tramite l'app Gemini, Gemini in Chrome o la Ricerca. Una buona notizia sul fronte della trasparenza, anche se resta da vedere quanto questo sistema sarà davvero adottato nella pratica.L'articolo Google lancia Nano Banana 2 Lite e Gemini Omni Flash: immagini in 4 secondi e video editabili a parole sembra essere il primo su Smartworld.