La generazione di immagini tramite strumenti di intelligenza artificiale è una pratica molto recente che si è rapidamente diffusa a livello di massa, sia nella sua forma statica che in quella di video, ed è salita agli onori della cronaca grazie ad alcuni sorprendenti deepfake, che rappresentavano personaggi celebri in situazioni decisamente improbabili. Questo fenomeno ha profonde implicazioni che è bene cominciare ad analizzare.

Si tratta di una tecnologia che permette di creare immagini originali a partire da input testuali, i prompt, o da altri dati, come semplici disegni e immagini, sfruttando modelli di apprendimento automatico addestrati su grandi archivi di immagini e descrizioni testuali. Utilizzando reti neurali profonde, tali tecnologie addestrano il modello con milioni di esempi, affinché esso assimili le relazioni tra testo e immagine, nonché le caratteristiche visive come forma, colore, texture e composizione. Il modello così addestrato può essere usato dall’utente. Ricevute e comprese le indicazioni dal prompt grazie a tecniche NLP (Natural Language Processing), il modello di intelligenza artificiale cerca le immagini pertinenti descritte nel suo enorme archivio, sfruttando le etichette testuali che le codificano. Non si limita a reperire le immagini, ma traduce le indicazioni del prompt in algoritmi di rielaborazione visiva delle stesse, che definiscono lo stile, le dimensioni, la composizione, la luce, creando una prima concettualizzazione visiva. A quel punto, usando diverse metodologie, come la “diffusione” o le “reti antagoniste generative” (GAN), genera progressivamente una o più immagini ex novo, sintesi delle immagini in archivio, sempre rielaborate e diverse da quelle originali. I risultati possono essere ulteriormente modificati o perfezionati nei dettagli, sia mediante altri prompt, sia mediante tecniche di elaborazione specializzate, come l’”inpainting” o il ”retexture”.

La tecnologia qui descritta si presenta come rivoluzionaria nel rapporto storico tra uomo e immagine e, come la fotografia, ridefinisce millenni di fare artistico, tradizionalmente basato su azioni oculo-manuali. Come per la fotografia, che provocò la nascita dell’arte moderna, assolutamente discontinua rispetto alle forme artistiche precedenti, ci possiamo aspettare un’analoga rivoluzione nel comparto della comunicazione visiva e dell’arte contemporanea. Il ruolo dell’artista “esteso” dall’intelligenza artificiale è tutto da definire. Con le tecnologie text to image nuove figure entreranno nel campo delle arti visive, creando una discontinuità che può riaprire connessioni con vasti settori della società, perdute in decenni di eccessivo elitarismo. Ma questo implica un totale riposizionamento dell’arte stessa con esiti che ancora è difficile immaginare.