Kuvien generointi kehittyy harppauksin - Dall-e 3 nyt käytettävissä

Yritystoiminnassa on perinteisesti käytetty suuria kuvapankkeja kuvituskuvien hankkimiseksi. Tarvitaan kuvia sitten nettisivuille, PowerPoint esitykseen tai muuhun markkinointimateriaaliin on kuvia ollut saatavilla loputtomasti niin maksullisista kuin ilmaisistakin palveluista. Onko tämä nyt muuttumassa? Tarvitaanko enää kuvapankkeja, kun hakutermin sijasta voi kirjoittaa kehotteen ja kuva luodaan uniikkina juuri kehotteen mukaisesti?

OpenAI:n uusi version kuvia generoivasta Dall-e tekoälystä on nyt saatavilla Microsoftin palvelun kautta: https://www.bing.com/images/create 

Puolessa vuodessa on tapahtunut huima parannus kuvien laadussa. Ongelmalliset kohdat kuten sormet ja silmät realistisissa kuvissa ovat parantuneet lähes täydellisiksi. Jos seuraavan puolen vuoden aikana tapahtuu vastaava hyppy taitaa kuvapankit olla kohta historiaa.

Microsoftin palvelun kautta käyttäen ongelma on vielä siinä, että käytössä on vain ns. one-shot mahdollisuus. Open AI on luvannut, että syksyn aikana Dalle-e 3 on käytettävissä myös ChatGPT:n kautta, jolloin konteksti pysyy samana ja samaa visuaalista tyyliä pystyy rakentamaan keskustellen eteenpäin ja luomaan vaikka koko yrityksen brändi-ilmeen sen avulla. 


Yksi kuva kertoo enemmän kuin tuhat sanaa

Otin testausesimerkiksi lelukaupan brändi-ilmeen rakentamisen. Hakien sopivaa tyyliä logoon, webbisivuihin, mainoskuviin ja miksei kaupan itsensäkin kuvittamiseen. Kun konteksti ei ole koko ajan sama, on siinä vielä haasteensa, mutta kuvat ovat loistavia. Dall-e:n uusi versio sallii huomattavan pitkät kehotteet, jossa voi tarkkaan määritellä kuvan sisällön. Näissä esimerkeissä annoin sille kuitenkin melko vapaat kädet (jos ilmaisu sallitaan).


Tässä näitä esimerkkejä kehotteineen.



Lelukaupan Logo
Prompt: Old style shop label with test: "Toy shop", pastel pink, wooden, hanging, white background

Lelukaupan nettikaupan design.
Prompt: Web site design for toy shop, pastel pink colors, paper art style, toy online store, on white tablet screen

Lelukaupan t-paita
Prompt: white normal realistic t-shirt, picture in the t-shirt has paper art style toys,  logo above picture "Toy Shop", pastel pink colors 

Tästä tuli kuvituskuva, kun aina se ei ohjeita seuraa täsmällisesti.
Prompt: Old style shop title: Toy shop, pastel pink, wooden, nothing else

Tästä lähdin liikkeelle kehittelemään ideaa.
Prompt: Title: My Toy shop, all toys are paper cuts, pastel colors, In beautiful environment, luxury style paper toys, fine art, photo-realistic


Ja pakollinen Barbie kuva.
Prompt: barbie, in wooden Barbie car, pastel pink colors, paper art style


Myös realistisemmat kuvat onnistuvat. Alla pari esimerkkiä.


Prompt: toys are us style cars on the front-yard of futuristic log house

Prompt: toys are us style toys on the kids' bedroom floor
(Ehkei ihan ymmärtänyt mitä halusin. Kirjoitin promptin väärin, mutta kuva on hyvä.)

Prompt: toys are us style toys on the kids' bedroom floor
(Ehkei ihan ymmärtänyt mitä halusin. Kirjoitin promptin väärin, mutta kuva on hyvä.)


Tässä vielä lopuksi vinkki: Nyt tekemään räätälöityjä satukirjoja lapsille. Koskaan se ei ole ollut yhtä helppoa kuin Dalle-e:n avulla. 

Dall-e generoi aina neljä kuvavariaatiota, joista voi valita. Näistä seuraavista en osannut päättää, mikä olisi paras, mutta jotenkin juuri tämän paper art tyyli sopisi satukirjoihin.  

Prompt: little girl, playing with cat, in a far away planet, mystic flowers, mountains and lake in background, paper art















Kommentit

Tämän blogin suosituimmat tekstit

Mitä olemme oppineet generatiivisesta tekoälystä ensimmäisen vuoden aikana

AI-avusteinen projektinhallinta – käyttöön jo tänään

Synteettinen teksti - yritystekstien tulevaisuus