Mitä tekoäly on ja mihin sitä voi käyttää?

Määrittelyjä

Mitä tekoälyllä tarkoitetaan

Tekoäly (AI, artificial intelligence) on yleisnimitys menetelmille, joissa tietokoneet suorittavat tehtäviä, jotka perinteisesti vaativat ihmisen ajattelua (esim. kielen ymmärtäminen, kuvien tunnistus, päätöksenteko).

Nykyisiä käyttösovelluksia arjessa

Tekoäly on ollut arkipäivää monissa palveluissa jo pitkään, usein huomaamattamme:

  • Hakukoneet ja käännöspalvelut (Google Translate, DeepL)
  • Puheohjaus (Siri, Alexa)
  • Navigointi ja reitinhaku (Google Maps)
  • Suositusjärjestelmät (YouTube, Netflix, verkkokaupat)
  • Kuvien tunnistus ja muokkaus (esim. älypuhelimissa, tunnistaa ihmiset)
  • Chatbotit ja asiakaspalvelurobotit
  • Pesukoneen lämpötilan, veden ja pesuaineen määrän sekä rummun liikkeiden optimointi pyykin likaisuuden perusteella
  • Robotti-imurit ja -ruohonleikkurit

Erityiseen huomioon on noussut generatiivinen tekoäly, joka pystyy tuottamaan uutta sisältöä: tekstiä, kuvia, musiikkia, videoita tai koodia, sellaisella laadulla joka aiemmin on ollut vain ihmiselle mahdollista.



Suuret kielimallit (LLM, Large Language Models)

ovat tekoälymalleja, jotka on suunniteltu "ymmärtämään" ja luomaan ihmisen kieltä. Ne ovat pohjimmiltaan erittäin monimutkaisia tilastollisia ennustuskoneita.

Tärkeä huomio: tekoäly ei ymmärrä asioita ihmisen tavoin, vaan tuottaa vastauksia mallintamalla valtavista aineistoista opittuja tilastollisia yhteyksiä.

Yksinkertaistettuna LLM-mallien toiminta perustuu seuraaviin vaiheisiin:

  1. Koulutus valtavalla datamäärällä
    LLM-mallit koulutetaan käyttämällä valtavia tekstimääriä (miljardeja tai jopa biljoonia sanoja), jotka on kerätty esimerkiksi kirjoista, artikkeleista, koodista ja internetistä. Tämä prosessi vaatii erittäin suuren laskentatehon.

    Tunnistaminen ja tokenisointi: Malli ei käsittele suoraan sanoja, vaan se pilkkoo tekstin pienempiin osiin, joita kutsutaan tokeneiksi (voivat olla sanoja, sanan osia tai jopa yksittäisiä merkkejä).

    Oppiminen: Koulutuksen aikana malli oppii tunnistamaan tilastolliset suhteet ja todennäköisyydet sille, mitkä sanat tai tokenit esiintyvät todennäköisimmin peräkkäin tietyissä yhteyksissä. Se oppii kielen kieliopin, semantiikan ja kontekstin.

  2. Muuntaja-arkkitehtuuri (Transformer)
    LLM-mallit perustuvat tyypillisesti muuntaja-arkkitehtuuriin (transformer), joka käyttää huomiomekanismia (attention mechanism).

    Huomiomekanismi: Sen avulla malli pystyy "kiinnittämään huomiota" (painottamaan) eri osiin syötetekstistä tai jo luodusta tekstistä. Tämä on ratkaisevaa kontekstin ymmärtämisessä, sillä malli voi tunnistaa kauempana olevien sanojen väliset riippuvuudet lauseessa tai kappaleessa. Esimerkiksi lauseessa "Kissa istui matolla, se nukkui" huomiomekanismi auttaa mallia ymmärtämään, että "se" viittaa "kissaan".

  3. Ennustaminen (Generointi)
    Kun käyttäjä antaa mallille kehotteen (input, prompt), mallin päätehtävä on ennustaa seuraava todennäköisin tokeni sarjassa.

    Token kerrallaan: Malli luo vastauksen token kerrallaan. Jokaisen luodun tokenin jälkeen malli käyttää koko aiemman kontekstin (alkuperäinen kehote + tähän mennessä luotu teksti) ennustaakseen seuraavan tokenin.

    Tilastollinen valinta: Malli laskee todennäköisyydet kaikille mahdollisille seuraaville tokeneille ja valitsee niistä yhden (usein painotetulla satunnaisuudella), mikä selittää, miksi malli ei tuota aina täsmälleen samaa vastausta samasta kehotteesta.

    Ihmismäinen teksti: Toistamalla tätä prosessia tuhansia kertoja, malli rakentaa lauseita, kappaleita ja lopulta ihmismäistä tekstiä, joka on sisällöltään johdonmukaista ja kontekstiin sopivaa.

Yhteenveto
LLM-mallit toimivat siis erittäin monimutkaisina tilastollisina kielen mallintajina, jotka valtavan datamäärän ja edistyneen neuroverkkoarkkitehtuurin (muuntaja) avulla pystyvät ennustamaan, mikä teksti on todennäköisintä ja luonnollisinta seuraavaksi.