Kehotesuunnittelu (Prompt Engineering)

Kehotesuunnittelu (Prompt Engineering)



Vuorovaikutus suurten kielimallien (LLM, Large Language Model) kanssa tapahtuu pääasiassa luonnollisen kielen avulla: käyttäjä kirjoittaa ohjeen mallille tekstikenttään, ja malli tuottaa vastauksen. Joissakin tapauksissa vuorovaikutus on mahdollista myös puheen avulla. Kehotesuunnittelulla tarkoitetaan tapaa, jolla vuorovaikutus tekoälyn kanssa muotoillaan, jotta saavutetaan haluttu lopputulos. Kehotesuunnittelun eri tekniikat perustuvat osittain tieteelliseen tutkimukseen, mutta ovat suurelta osin käytännön kokeilun ja yhteisön kokemusten tulosta. Tehokas kehotesuunnittelu ei ole pelkästään kysymyksen esittämistä, vaan se on strateginen taito, jossa huomioidaan selkeys, konteksti ja tavoitteet. Mallille annettavalla ohjeella tarkoitetaan mitä tahansa käyttäjän antamaa tekstimuotoista syötettä, jonka tarkoituksena on kertoa mallille, mitä sen tulisi tehdä. Malli tulkitsee tämän ohjeen, suorittaa tehtävän ja palauttaa vastauksen. Vastausta kutsutaan tulosteeksi. Generatiiviset tekoälymallit voivat tuottaa erityyppisiä tulosteita riippuen mallin käyttötarkoituksesta. Esimerkiksi kuvien luontiin tarkoitetut mallit, kuten Stable Diffusion tai Midjourney, palauttavat kuvatiedostoja, kun taas tekstimallit tuottavat tekstipohjaisia vastauksia. (How to Use ChatGPT in Education 2023).

Ohje voi olla yksinkertainen kysymys, kuten "Missä sijaitsee Atlantin valtameren syvin kohta?", tai se voi olla luova pyyntö, esimerkiksi "Laadi runon sanat Johan Ludvig Runebergin tyyliin.". Monimutkaisemmissa tapauksissa ohje voi sisältää yksityiskohtaisia tietoja tai tarkempia ohjeita, joiden avulla malli osaa suunnata tuotoksensa juuri käyttäjän tarpeiden mukaisesti. LLM:t rakentavat vastauksensa valtavan tietomäärän pohjalta. Se, mitä dataa malli käyttää ja mitä dataa käyttäjä on mallille mahdollisesti antanut tavoitteen toteuttamiseksi, vaikuttaa olennaisesti siihen, millainen tuloste lopulta syntyy. Kaikkein ratkaisevinta on, miten käyttäjä ohjeensa muotoilee. Hyvin suunniteltu ohje tuottaa laadukkaan ja käyttäjän tavoitteita vastaavan tuloksen. Tämän vuoksi mallien vahvuuksien ja rajoitusten tuntemus käytännön kautta on tärkeää. (How to Use ChatGPT in Education 2023).

Jo pienet muutokset ohjeen muotoilussa voivat johtaa täysin erilaisiin lopputuloksiin, sillä tekoälyn tuottamissa vastauksissa esiintyy satunnaisuutta. Kielimallit on koulutettu ennustamaan seuraavaa sanaa tekstissä, joten mitä tarkemmin ohje on muotoiltu, sitä paremmin tuloste mahdollisesti vastaa käyttäjän tarpeita. Sama ohje voi tuottaa hieman erilaisia tulosteita eri kerroilla. Malli voi myös tuottaa sisältöä, joka vaikuttaa uskottavalta mutta ei perustu paikkansapitävään tietoon. Hyvin rakennettu ohje voi siten auttaa minimoimaan tällaiset virheet. Joissain tapauksissa ohjeen kirjoittaminen edellyttää erityistä asiantuntemusta. Esimerkiksi lääketieteen sovelluksissa, kun tekoälyltä pyydetään hoitosuosituksia, tarvitaan syvällistä alan tuntemusta sekä oikeanlaisen sanaston että tuotoksen arvioinnin näkökulmasta. (How to Use ChatGPT in Education 2023).

Kehotesuunnittelun osatekijät/komponentit

Kun kehität ohjetta, yksinkertaisimmillaan käyttäjien on sisällytettävä ainakin yksi seuraavista:

  • Ohjeet
  • Kysymys

Ohjeiden tai kysymyksen lisäksi käyttäjät haluavat todennäköisesti sisällyttää jonkin näiden kahden valinnaisen osatekijän ohjeeseensa ohjatakseen algoritmia kohti tulostetta, joka on hyödyllisin:

  • Syötedata
  • Esimerkit

Syötedatan avulla mallille voidaan antaa lisätietoa siitä, millainen tuloste halutaan. Tällainen data voi olla mitä tahansa yksinkertaisesta yleisökuvauksesta (esimerkiksi ikä, koulutus tai sijainti) monimutkaisiin taulukoihin asti. Lisäksi voidaan määritellä toivottu sävy tai tyyli, jolla malli vastaa. (How to Use ChatGPT in Education 2023).

Erilaisia kehotesuunnittelun tekniikoita

Zero-shot, One-shot ja Few-shot ohjeistaminen ovat käsitteitä, jotka liittyvät siihen, kuinka paljon tietoa käyttäjä antaa generatiiviselle tekoälymallille ohjeistamisen yhteydessä. (How to Use ChatGPT in Education 2023). Kehotesuunnittelu ei perustu täysin tieteelliseen tutkimukseen, vaan erilaiset kehotesuunnittelun tekniikat ovat kehittyneet tutkijoiden ja käyttäjäyhteisöjen kokemusten tuloksena.

Zero-shot (Nolla laukausta):

Nollan laukauksen ohjeistaminen tarkoittaa sitä, että käyttäjä antaa mallille ohjeet ilman mitään lisätietoja tai esimerkkejä. Malli yrittää silti tuottaa järkevän vastauksen tai tulosteen pelkästään annettujen ohjeiden perusteella. Esimerkki: Käyttäjä antaa ohjeen "Kerro minulle merestä", ilman lisätietoja tai esimerkkejä. Malli yrittää tuottaa sopivan vastauksen pelkästään tällä ohjeella. (Prompting Techniques 2024).

One-shot (Yksi laukaus):

Yhden laukauksen ohjeistaminen tarkoittaa sitä, että käyttäjä antaa mallille yhden esimerkin tai lisätiedon vastauksen luomiseksi. Malli käyttää tätä yhtä esimerkkiä ymmärtääkseen, mitä käyttäjä haluaa. Esimerkki: Käyttäjä antaa ohjeen "Kerro minulle Atlantin valtamerestä". Malli käyttää tätä yhtä esimerkkiä tuottaakseen sopivan vastauksen. (Prompting Techniques 2024).

Few-shot (Muutama laukaus):

Muutaman laukauksen ohjeistaminen tarkoittaa sitä, että käyttäjä antaa mallille useita esimerkkejä tai lisätietoja vastauksen luomiseksi, mutta ei tarpeeksi, että voitaisiin puhua laajamittaisesta kattamisesta, jossa on kyse hyvin yksityiskohtaisesta kehotteesta kuvauksineen. Kuten mainittiin, käyttäjän antamien esimerkkien määrä ja syötedatan yksityiskohdat voivat vaikuttaa merkittävästi tulokseen. Ohjeistuksen suunnittelijat käyttävät tarkkoja termejä kuvaamaan annettujen datapisteiden määrää. Esimerkki: "Kerro minulle Atlantin valtameressä elävistä selkärankaisista eläimistä.". (Prompting Techniques 2024).

Eri tekniikoiden yhdistely mahdollistaa monipuoliset ja tehokkaat käyttötavat tekoälylle, ja auttaa käyttäjää saamaan täsmällisempiä, luotettavampia ja hyödyllisempiä vastauksia. Yleisimmät kehotesuunnittelun tekniikat voidaan jakaa useisiin kategorioihin: (Prompting Techniques 2024).

  1. Roolittaminen (Role Prompting):
    Tässä tekniikassa tekoälylle annetaan rooli, kuten "Toimi veroasiantuntijana". Roolitus ohjaa tekoälyn vastaustyyliä ja näkökulmaa, mikä auttaa tuottamaan asiantuntevampia ja tilanteeseen sopivampia vastauksia.
  2. Esimerkkipohjainen kehottaminen (Example-based prompting):
    Kehotteeseen lisätään yksi tai useampi esimerkki halutusta vastauksesta. Tämä auttaa mallia ymmärtämään, minkälaista muotoa, tyyliä tai sisältöä käyttäjä toivoo.
  3. Ketjuttaminen (Chain-of-thought prompting):
    Mallia kehotetaan "ajattelemaan ääneen", esimerkiksi pyytämällä perustelemaan vastauksensa vaihe vaiheelta. Tämä parantaa monimutkaisten tehtävien ratkaisujen tarkkuutta, kuten loogisessa päättelyssä tai matemaattisissa ongelmissa.
  4. Rajoittaminen ja ohjaaminen (Constrained prompting):
    Kehotteessa määritellään selkeästi esimerkiksi vastausten pituus, muoto (taulukko, lista, kappale), kieltäytymiskriteerit tai näkökulma. Tämä sopii hyvin käytettäväksi tilanteissa, joissa halutaan yhdenmukaisia ja ennakoitavia vastauksia.
  5. Iteratiivinen kehottaminen (Iterative prompting):
    Kehotetta muokataan ja täsmennetään useissa vaiheissa saatujen vastausten perusteella. Tämä tekniikka sopii luovaan työskentelyyn ja ongelmanratkaisuun, joissa lopullinen tavoite selkeytyy vasta prosessin aikana.
  6. Meta-kehottaminen (Prompt about prompts):
    Käyttäjä voi pyytää tekoälyä itse suunnittelemaan parhaan mahdollisen kehoteformaatin haluttuun tarkoitukseen, esimerkiksi: "Laadi tehokas kehote, jolla voidaan luoda harjoitustehtäviä kielioppikurssille."

Laajamittainen kattaminen (comprehensive coverage)

Laajamittaisesta kattamisesta ei löydy lähdekirjallisuutta, vaan tämä on mitä ilmeisemmin tämän kirjoittajan oma käytännön kautta havaittu kehotesuunnittelun menetelmä. Laajamittainen kattaminen toimii parhaiten kuvien luontiin. Kehotetekniikassa on kyse siitä, että käyttäjä kuvailee kuvaa luodessa todella yksityiskohtaisesti kaikki ne tekijät, jotka tarpeisiin sopivan kuvan kannalta ovat relevantteja. Esimerkiksi kuvailet tarkasti kuvassa esiintyvien henkilöiden vaatetyylit ja värit, vartaloiden ominaisuudet, taustalla näkyvät maisemat. Tyypillisesti laajamittaisen kattamisen kehotteet ovat hyvinkin pitkiä. Tällä tekniikalla saadaan useimmiten tarpeeseen sopiva tuloste.