Pogled na novu Al Generative Art

Al Generative Art je vrsta umjetnosti, u većini slučajeva vizualne, koja se temelji na suradnji između čovjeka i autonomnog sustava. "Autonomni sustav" definiran je kao Umjetna inteligencija softver, algoritam ili model sposoban za izvođenje složenih operacija bez potrebe za intervencijom programera.

Od bizarnih jukstapozicija slika koje je stvorio Dall-E Mini prema NFT na tržištu, slike generirane AI algoritmima sve više ulaze u mainstream maštu. Zapravo, dva važna projekta na tu temu koja zaslužuju analizu su: Sredina putovanja i DALL-E2.

Naravno, vijest je stigla i do Twittera. Komentirao je, između ostalih, Charles Hoskinson, koji je napisao:

Generativna umjetnost: rani eksperimenti i značajke

Nakon što smo shvatili što je Generativna umjetnost, važno je naglasiti jedno od njezinih temeljnih načela: slučajnost. Što je temeljno svojstvo Generativne umjetnosti.

Zapravo, ovisno o vrsti softvera, autonomni sustav može obraditi rezultate koji su uvijek različiti i jedinstveni svaki put kada se izvrši naredba za generiranje, ili može vratiti različiti broj rezultata kao odgovor na korisnički unos.

Prvi eksperimenti u generativnoj umjetnosti datiraju iz 1960-ih s eksperimentima Harold Cohen i njegov AARON program. Cohen je prvi upotrijebio samostalni softver za generiranje apstraktnih umjetničkih djela inspiriranih pop art sitotiskom. Cohenovi radovi sada su izloženi u galeriji Tate u Londonu.

Još jedan atribut Generativne umjetnosti, ali onaj koji je sve manje prerogativ, jest ponavljanje uzoraka ili apstraktnih elemenata koje daje programer i implementira u programski kod.

Osim toga, razvoj sve složenijih neuronskih mreža koje rade na povezivanju teksta i slike omogućio je razvoj generativnih modela sposobnih za stvaranje sve realističnijih i preciznijih slika. Najpoznatiji primjer ove kategorije generativne umjetnosti je Ploča.

Dall-E je multimodalna neuronska mreža temeljena na GPT-3 model dubokog učenja iz OpenAI, iste tvrtke koja se također nedavno razvila ChatGPT, chatbot pokrenut u studenom 2022. i optimiziran s “nadzirano” i tehnike učenja s potkrepljenjem.

Vraćajući se na Dall-E, vidimo da je ovaj sustav sposoban generirati slike iz tekstualnog opisa, koji se naziva "potaknuti," na temelju skupa podataka parova tekst-slika.

Prva verzija Dall-E-a, koja je javnosti predstavljena u siječnju 2021. godine i ostala je prerogativ malog broja profesionalaca u tom području, predstavljala je pravu revoluciju u pogledu ove vrste generativnog modela, nadmašivši inovacije GPT-a. 3 sama.

Također je od značaja činjenica da se točnost rezultata koje je obradio Dall-E pokazala kao savršen prostor za još jedno OpenAI rješenje: CLIP (Priprema za kontrastivni jezik-slika).

Neuralna mreža za klasifikaciju i rangiranje slika trenirana na temelju asocijacija teksta i slike, kao što su opisi pronađeni na Internetu. Zahvaljujući intervenciji CLIP-a, koja smanjuje broj rezultata predloženih korisniku po upitu na 32, utvrđeno je da Dall-E vraća zadovoljavajuće slike u većini slučajeva.

Midjourney: dizajn, ljudska infrastruktura i umjetna inteligencija

Kao što se očekivalo, Sredina putovanja je važan projekt koji je dio koncepta Al Generative Art u nastajanju. Konkretno, Midjourney je neovisni istraživački laboratorij koji istražuje nove načine razmišljanja i proširuje imaginativne moći ljudske vrste.

Korištenje je jednostavno: prvo se mora kreirati račun na Nesloga, platforma koja ugošćuje razne zajednice, a Midjourney je jedna od njih. Unutar aplikacije nalaze se razne chat sobe u kojima se može aktivno ili ne sudjelovati u raspravama.

Važno je istaknuti da se za prvi pokušaj korištenja umjetne inteligencije mora otići na "novi" kanala, gdje 25 besplatnih rendera su dostupni.

Jedno renderiranje odgovara generiranju četiri različite varijante generirane iz istog tekstualnog unosa.

Dakle, 25 renderiranja odnosi se na 25 poslova obrade koje obavlja Midjourney bot. Slijedom toga, generiranje slike zahtijeva interakciju s botom Midjourney putem tekstualne poruke koja se naziva "upit", u kojoj će biti ključne riječi koje opisuju sliku koju korisnik ima na umu.

Možete dodati koliko god detalja želite, važno je da ključne riječi podijelite zarezom. Nakon što je renderiranje završeno, računalo vraća četiri različite slike na temelju opisa koje možete izabrati.

Osim toga, nakon što program završi renderiranje, možete priopćiti svoje preferencije na temelju slika i, ako želite, ponovno generirati još četiri verzije.

DALL-E 2: novi AI sustav za umjetnička djela

Uz Midjourney, DALL-E 2 također je novi AI sustav koji može stvoriti realistične slike i umjetnička djela iz opisa prirodnog jezika. I ne samo to, DALL-E 2 također može kombinirati koncepte, atribute i stilove.

Snaga novog AI sustava također leži u mogućnosti proširivanja slika izvan onoga što je na originalnom platnu, stvarajući nove ekspanzivne kompozicije. Osim toga, može napraviti realistične promjene na postojećim slikama iz naslova na prirodnom jeziku i može dodavati i uklanjati elemente uzimajući u obzir sjene, refleksije i teksture.

Mogućnosti DALL-E 2 također uključuju snimanje slike i stvaranje nekoliko njezinih varijacija inspiriranih originalom. DALL-E 2 je naučio odnos između slika i teksta koji se koristi za njihov opis.

Koristi proces tzv "difuzija", koji počinje s uzorkom nasumičnih točkica i postupno mijenja taj uzorak prema slici kada prepozna specifične aspekte te slike.

Dakle, nakon što je OpenAI predstavio DALL-E u siječnju 2021., sada najnoviji sustav, DALL-E 2, generira realističnije i preciznije slike s četiri puta većom rezolucijom.

DALL-E 2 započeo je kao istraživački projekt i sada je dostupan kao beta verzija. Sigurnosna ublažavanja koja je sustav razvio i nastavlja poboljšavati uključuju: ograničavanje sposobnosti sustava da generira nasilne slike, slike mržnje ili slike za odrasle i postupnu implementaciju temeljenu na učenju.

Izvor: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/