Niente panico, la pittura AI non può uccidere l’arte

Un giorno di pittura AI è un anno sulla terra.

Dall-E 2 e Midjourney, divenuti popolari nella prima metà dell’anno, sono stati completamente oscurati da Stable Diffusion nella seconda metà dell’anno.

I recenti prodotti di disegno a caldo hanno tutti “diffusione” nel nome e beneficiano tutti dell’algoritmo di “diffusione” dell’intelligenza artificiale. Questo algoritmo rompe il punto critico dell’applicazione della pittura AI, che è più facile da usare e con effetti migliori.

La pittura a macchina ha una storia di mezzo secolo e nel giro di due anni la pittura AI è diventata improvvisamente un “gigante attaccante”. Non solo la qualità è migliorata visibile ad occhio nudo, ma anche la velocità di generazione delle immagini è stata ridotta da pochi ore all’inizio dell’anno a più di dieci secondi di campana.

Progressi significativi nella tecnologia di pittura con intelligenza artificiale hanno suscitato interesse per “IA creativa”, una gamma di strumenti di intelligenza artificiale che imitano la creatività umana, dall’arte alla poesia. Ma nessuno si è davvero sentito prendere dal panico.

9E81mEZtK6i 6smJPJJ4C6yTrCDmya76 - Niente panico, la pittura AI non può uccidere l’arte

Tempo fa, molte persone hanno ipotizzato che Yan Ning, un biologo, abbia lasciato gli Stati Uniti e sia tornato in Cina perché il sistema di intelligenza artificiale AlphaFold poteva prevedere la struttura delle proteine ​​ed è stato derubato del suo lavoro. In effetti, il software in grado di scrivere informazioni sulle notizie esiste da tempo e nessun giornalista ha perso il lavoro a causa di ciò. L’intelligenza artificiale non può nemmeno sostituire le persone che scrivono cubetti di tofu, figuriamoci i migliori scienziati.

Cos’è l’algoritmo di diffusione

Gli attuali modelli di intelligenza artificiale utilizzano reti neurali di deep learning. I modelli di autoapprendimento, come GPT-3 è il più famoso di questi modelli, che “apprenderanno” sulla rete neurale di circa 45 TB di dati di testo e genereranno lavori che sono quasi gli stessi dell’output umano.

Stable Diffusion fa parte della famiglia del deep learning. Nello specifico, Stable Diffusion apprende la connessione tra immagini e testo attraverso un modello di diffusione latente. Funziona prendendo i dati dell’immagine e aggiungendovi “rumore”. Il rumore, chiamato anche rumore, si riferisce ai punti ruvidi nelle immagini acquisite dalle apparecchiature fotografiche digitali, che sono generalmente prodotti da interferenze elettroniche.

Un’immagine viene gradualmente aggiunta di rumore finché l’intera immagine non diventa rumore bianco. Il modello registra questo processo e lo inverte affinché l’IA possa apprenderlo.

Dal punto di vista dell’intelligenza artificiale, la prima cosa che vedi è un’immagine piena di rumore, poi vedi che l’immagine diventa più chiara e infine diventa un dipinto. Ciò che l’IA impara è l’intero processo di denoising, in particolare come gestire il rumore gaussiano e infine generare dipinti.

Il rumore gaussiano si riferisce a un tipo di rumore la cui funzione di densità di probabilità obbedisce alla distribuzione gaussiana (cioè distribuzione normale).L’algoritmo di diffusione aggiunge rumore gaussiano.Uno è verificare la validità dell’immagine “reale”, perché le immagini nell’ambiente di utilizzo sono tutti rumorosi Uno è per comodità di apprendimento, fintanto che il rumore non è conforme alla distribuzione normale standard, non sarà valido.

Il database base di Stable Diffusion si chiama LAION-Estetica, contiene immagini con illustrazioni, ed è filtrato anche per “stile estetico”. Altri modelli di intelligenza artificiale addestrati hanno anche “corretto” il database per prevedere come le persone avrebbero risposto alle valutazioni “quanto ti piace questo dipinto” al fine di eliminare alcuni contenuti pornografici.

In che modo è diverso dai “predecessori”

Stable Diffusion è simile a Dall-E 2 e Midjourney in quanto si basa sulla “descrizione del testo” per generare immagini.

Tuttavia, Stable Diffusion è open source e il suo codice sottostante è pubblicamente disponibile. Né Open AI né Google hanno rilasciato i propri modelli di intelligenza artificiale.

Stability AI comprende oltre 4.000 GPU NVIDIA A100 in esecuzione su Amazon Cloud (AWS). Secondo i rapporti, i costi operativi e di spesa per il cloud di Stability AI superano i 50 milioni di dollari.

La società afferma di poter fornire una “svolta in termini di velocità e qualità” e che possono funzionare anche GPU con meno di 10 GB di memoria. Forniranno anche versioni in esecuzione su chip AMD, Apple M1/M2.

Attualmente, la funzione di diffusione stabile è che può convertire il testo in un’immagine di 512 × 512 pixel in pochi secondi; l’immagine può essere trasformata, ingrandita, modificata e sostituita; utilizzando la modellazione GFP-GAN, consentendo agli utenti di caricare immagini facciali sfocate per ingrandire o ripristinare l’aspetto originale.

Il mese scorso, Stability AI ha raccolto $ 101 milioni. Il CEO Emad Mostaque si è laureato all’Università di Oxford con un master in matematica e informatica e in precedenza ha lavorato come analista presso vari hedge fund. Attualmente, la società ha un valore di $ 1 miliardo.Oltre a Stable Diffusion, c’è anche Dance Diffusion, l’editing musicale.

Il piano redditizio di Stability AI è quello di addestrare modelli “privati” e piattaforme infrastrutturali generiche per i clienti. Dispone di una piattaforma, DreamStudio, accessibile anche ai singoli utenti. Oggi DreamStudio ha oltre 1,5 milioni di utenti che hanno creato circa 200 milioni di immagini. Contando tutti i canali, Stable Diffusion ha più di 10 milioni di utenti.

La società ha anche assunto uno scienziato di alto profilo e futurista di Google Daniel Jeffries.

Questa è arte?

Con l’annuncio di varie intelligenze artificiali, aumentano anche le questioni etiche e legali correlate. Stable Diffusion consente la generazione di immagini di vita reale e il problema diventa più “serio”.

Stable Diffusion è stato utilizzato dagli utenti per creare molti contenuti sensibili e foto di celebrità false stanno volando dappertutto. Getty Images ha vietato il caricamento di immagini generate da Stable Diffusion a causa di problemi di proprietà intellettuale.

La rappresentante della Camera dei rappresentanti degli Stati Uniti Anna G. Eshooo ha recentemente pubblicato una lettera in cui esorta il consigliere per la sicurezza nazionale degli Stati Uniti e l’Office of Science and Technology Policy ad affrontare questi “modelli non sicuri”.

Nell’annuncio di rilascio, Stability AI ha annunciato una “licenza libera che consente l’uso commerciale e non commerciale”, che in realtà è un accordo con gli utenti. Si aspetta che gli utenti autoregolano il proprio comportamento e facciano la “cosa giusta” e ha scarso effetto nel punire gli utenti che non seguono le regole.

Oltre alle questioni legali, anche le opere generate dall’intelligenza artificiale sono soggette a sospetti.

Ad ogni modo, l’ufficio del copyright degli Stati Uniti considera queste immagini “non arte”. A febbraio, il comitato di revisione del Copyright Office ha respinto le richieste di immagini generate dall’intelligenza artificiale.

Il Review Board ha sottolineato che “la paternità umana è un prerequisito per la protezione del copyright” e richiede “la relazione tra pensiero umano ed espressione creativa”. Anche la corte federale degli Stati Uniti ha dichiarato in una recente sentenza che l’intelligenza artificiale non può essere considerata l’”inventore” di un brevetto.

L’arte dell’intelligenza artificiale è molto attraente e sebbene non sia legalmente riconosciuta, è riconosciuta dal mercato. Nel 2018, Christie’s ha venduto un dipinto di intelligenza artificiale per $ 435.000. Inoltre, la stragrande maggioranza dei consumatori non è in grado di distinguere tra i dipinti AI e le opere di pittori umani.

Il più controverso è il concorso artistico della Colorado State Fair di settembre di quest’anno, in cui ha vinto il primo premio l’opera di intelligenza artificiale “Théâtre D’opéra Spatial”, prodotta da Midjourney e l’operatore Jason Allen che ha dichiarato: “L’arte è morta, l’intelligenza artificiale vince, gli uomini perdono”.

In effetti, non c’è bisogno di generalizzare: nella creazione dell’intelligenza artificiale non c’è bisogno di essere eccessivamente ottimisti o esageratamente pessimisti.

La creazione artistica dell’intelligenza artificiale è prodotta secondo la “logica” degli esseri umani, naturalmente non è buona come le élite umane, ma è più che sufficiente per superare la mediocrità tra loro.

#Benvenuti a prestare attenzione all’account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr), altri contenuti interessanti ti verranno presentati il ​​prima possibile.

Ai Faner | Link originale · Visualizza i commenti · Sina Weibo