Arriva anche in Italia il supporto a Imagen 3, il generatore di immagini basato su Intelligenza Artificiale che promette risultati strabilianti e di altissima qualità. Per capire l’effettiva portata qualitativa che il modello porta con sé, basta sapere che le mani rappresentate da Imagen 3 appaiono estremamente realistiche, a differenza di quelle generate da altre AI.
I nostri test con Imagen 3 di Gemini
In effetti, da alcuni test effettuati, Imagen 3 sembra rispondere piuttosto bene – con qualche ovvio limite. Ora che è approdato anche in Italia, è possibile chiedere prompt nella nostra lingua: lo abbiamo provato per generare l’immagine di copertina di questo articolo, chiedendo all’AI “crea un’immagine con uno smartphone orizzontale, tenuto mano da una persona, e sullo schermo la scritta “Telefonino.net”. I colori devono essere viola e rosa”.
Il risultato è qualitativamente eccellente: la mano non ha dita extra, lo smartphone sembra piuttosto realistico. Abbiamo poi chiesto a Gemini di creare “un’immagine in cui la scritta “Telefonino” si trova al centro di uno sfondo formato da circuiti elettronici”. Detto fatto: la parola appare ben definita, seppur leggermente imprecisa in alcune lettere.
Infine, un test un po’ più elaborato: “Crea un’immagine disegnata in stile fumetto in cui vengono raffigurate le luci di una città futuristica che illuminano la notte, tra vicoli affollati, stand ambulanti, insegne al neon luminose e figure che passeggiano. Il meteo è piovoso, qualcuno ha un ombrello, altri indossano un impermeabile”. Il prompt ci ha costretto a sostituire la parola “persone” con “figure”, perché Gemini ci ricorda che “sarà presto in grado di generare immagini di persone”. Per il momento si limita a creare figure umanoidi di spalle o in lontananza.
Come utilizzare Imagen 3 in Italia
Naturalmente qualche limite c’è. Ad esempio, potrebbe accadere che Gemini non risponda correttamente a tutti i prompt che gli vengano proposti. Inoltre, non è (ancora?) in grado di generare immagini in formati diversi da quello quadrato 1:1, nemmeno chiedendolo espressamente. È tuttavia possibile notare una risoluzione maggiore rispetto ad altri concorrenti, come Dall-E di ChatGPT.
È possibile generare immagini illimitatamente: basta collegarsi al sito ufficiale di Gemini, effettuare il login e scrivere il proprio prompt nell’apposito spazio per ricevere, in cambio, un’immagine generata su misura dalle nostre parole.