Lastenkirja neljässä tunnissa - Tekoäly auttoi

OpenAI julkaisi viime viikon loppuna uuden ominaisuuden ChatGPT-palveluun. Dall-e 3 kuvien generointi onnistuu nyt keskustelemalla. Voit kertoa vapaasti, mitä haluat, ja ChatGPT luo siitä kehotteen kuvan generoimiseksi. Kuva syntyy keskustelun joukkoon ja sen voi ladata itselleen. OpenAI:n lisenssiehtojen mukaan kaikki kuvan oikeudet jäävät käyttäjälle. 


Kuvitus keskustelemalla

Edellisessä blogissani loin kuvia Microsoftin Bing-palvelun kautta. Sielläkin on takana Dall-e 3 -tekoäly, mutta käyttöliittymä on yksinkertaisempi one-shot-kehote. ChatGPT:n käyttöliittymässä voi sen sijaan rauhassa ensin rakentaa ajatusta keskustelemalla, ja kun tuntuu valmiilta, pyytää kuvan luomista. 

Ystäväni ehdotti lastenkirjan tekemistä ChatGPT:tä käyttäen. Eiköhän sitä kerran elämässä voi sellaiseenkin ryhtyä. Lastenkirjoissa on se hyvä puoli, että tekstiä on vähän. Tällä kertaa en käyttänyt tekoälyä tekstin tekemiseen vaan vartissa kirjoitin tarinan - toki mietein sen ensin valmiiksi mielessäni. 

ChatGPT ja Dall-e yhdistelmä on siinä mielessä vielä omapäinen, että se ei muista tai tiedä edellisestä kuvasta mitään muuta kuin sen kehotteen, millä kuva luotiin - ei siis lopputulosta. Siksi kirjaa tekiessä on haasteena saada kuvista saman tyylisiä. Käytin tähän koodausmenetelmää. Koska ChatGPT on suuri kielimalli, se osaa 'ihmisten' kielen lisäksi ohjelmointikieltä. Voit siis käyttää tekstin joukossa muuttujia, kunhan ensin sovit esitystavasta.


Tyylimäärittelyn toistaminen

Tässä lastenkirjaprojektissa käytin seuraavaa tekniikkaa: "/style = <tähän kuvan tyylimäärittely>". Kun sitten loin useita kuvia, ei minun tarvinnut jatkuvasti toistaa sitä tyyliä, vaan kirjoitin kehotteeseen "lisää /style". Uutta kehotteessa oli siten vain juuri sen kuvan asettelu. 

Tyylimäärittelyn pidän salaisuutena, mutta sitä iteroidessani olisin kyllä toivonut joskus lukeneeni edes sivun taidehistoriaa tai kuvataiteita. Sillä jos osaat viitata johonkin tällaiseen tunnettuun kuvataiteen tyyliin, tai vaikka pariin eri tyyliin, ja pyytää Dall-ea yhdistelemään niitä, saat luotua helposti tyylin, joka on omaperäinen ja luo yhtenäisen vaikutelman koko kirjalle. 


Soveltaminen työelämässä

Tällä samalla menetelmällä, kuin loin tämän lastenkirjan, voi luoda myös yritykselle tai vaikkapa projektille hahmon, joka esiintyy useammassa eri tilanteessa, mutta toistaen samankaltaista tyyliä. Vaikka Dall-e hyväksyy yllättävän pitkiä kehotteita ja pystyy seuraamaan paljon yksityiskohtia, on silti aina haasteena, että kuva ei ole ihan samanlainen. Tässä lastenkirjassa tämä näkyy vaikkapa hahmojen erilaisuutena eri sivuilla. Jos aikaa olisi käyttänyt neljä päivää neljän tunnin sijasta, olisi varmasti päässyt yhteneväisempään lopputulokseen. Tämän projektin idea oli kuitenkin tehdä nopeasti valmista.


Kirjaan pääsee tutustumaan täällä.


Ani Aasi on kirjan päähenkilö.


Kommentit

Tämän blogin suosituimmat tekstit

Mitä olemme oppineet generatiivisesta tekoälystä ensimmäisen vuoden aikana

AI-avusteinen projektinhallinta – käyttöön jo tänään

Synteettinen teksti - yritystekstien tulevaisuus