Tervetuloa kurssille

1. Le Chat -tekoälyn perusteet ja edistynyt käyttö

Kurssiesittely: Le Chat -tekoälyn perusteet ja edistynyt käyttö

Koe Euroopan vastine ChatGPT:lle! Le Chat on Mistral AI:n kehittämä monikielinen keskusteluavustaja, joka hyödyntää yhtiön omia malleja. Kurssi tarjoaa pedagogisen ja viihdyttävän tavan tutustua Mistral AI:n teknologiaan. Liity mukaan etäkurssille oman koneesi ääreltä.

Opitaan hyödyntämään LeChattia niin arjen kuin työelämänkin tilanteissa, kattaen myös kuvien luomisen. Le Chat -tekoälyavustajan kehittämisen taustalla on ranskalainen startup-yritys Mistral AI. Le Chat on suunniteltu parantamaan sekä henkilökohtaista että ammatillista tuottavuutta. Se tarjoaa ominaisuuksia, kuten projektiseurantaa, asiakirjojen tiivistämistä ja reaaliaikaista tiedonhakua. Mistral AI perustettiin huhtikuussa 2023 entisten Google DeepMind- ja Meta AI -asiantuntijoiden toimesta. Yritys on nopeasti noussut merkittäväksi toimijaksi Euroopan ja maailman tekoälykentällä. Yrityksen kehitys kuvastaa tekoälyteknologian nopeaa evoluutiota, ja sen tavoitteena on tarjota avoimia, siirrettäviä ja räätälöitäviä ratkaisuja.

Kurssin jälkeen, osaat:

- navigoida tekoälymaailmassa
- soveltaa oppimaasi omaan aiheeseen
- hyödyntää LeChattia niin arjen kuin työelämänkin tilanteissa, kattaen myös kuvien luomisen
- suunnitella oman kustomoidun tekoälyn
- osaat ohimennen oppien Ranskaa

1.1 Le Chatin ominaisuudet

Yksi Le Chatin keskeisistä ominaisuuksista on "Flash Answers," joka käsittelee tietoa vaikuttavalla nopeudella, noin 1 000 sanaa sekunnissa. Ranskalaisyrityksen mukaan tämä on nopeampaa kuin mikään muu chat-avustaja. Mistral AI:n videovertailussa malli päihitti sekä ChatGPT:n että Anthropicin Claude-tekoälymallin. Alusta sisältää kehittyneen asiakirjakäsittelyn optisen merkkien tunnistuksen (OCR) avulla, edistyneitä koodintulkintaominaisuuksia sekä huipputasoisen kuvageneroinnin, jonka taustalla on Black Forest Labsin Flux Ultra -teknologia. Käyttäjät voivat hyödyntää näitä ominaisuuksia myös iOS- että Android-sovellusten kautta, mikä tekee kehittyneestä tekoälyavusta helposti saatavilla olevan mobiililaitteilla.

Kevätlukukausi 20.–27.5.2025 (Kertoja: 2)

tiistai 20.5.2025	17:15–20:15	Online
tiistai 27.5.2025	17:15–20:15	Online

Mitä voin tehdä Mistral AI:lla?

Mistral AI on monipuolinen tekoälyjärjestelmä, joka voi auttaa sinua monilla eri tavoilla. Tässä on joitakin asioita, joita voit tehdä Mistral AI:n avulla:

1. Tiedonhaku: Voit etsiä tietoa verkosta ja saada ajantasaista tietoa eri aiheista.

2. Kuvien generointi: Voit pyytää tekoälyä generoimaan kuvia eri aiheista ja tyyleistä.

3. Koodin kirjoittaminen ja suorittaminen: Voit kirjoittaa ja suorittaa Python-koodia, mikä on hyödyllistä datan analysoinnissa, visualisoinnissa ja monissa muissa tehtävissä.

4. Tekstin kääntäminen: Voit kääntää tekstejä eri kielille.

5. Tiedostojen käsittely: Voit ladata ja käsitellä eri tiedostoja, kuten CSV- ja Excel-tiedostoja.

6. Matemaattiset laskut: Voit suorittaa monimutkaisia matemaattisia laskuja ja analysoida dataa.

7. Kysymysten vastaaminen: Voit kysyä tekoälyltä neuvoja ja ohjeita eri aiheista.

8. Uutisten haku: Voit etsiä uutisia tietystä aiheesta ja ajanjaksolta.

Nämä ovat vain joitakin esimerkkejä siitä, mitä voit tehdä Mistral AI:n avulla, mutta lista ei ole tyhjentävä.

Heränneet kysymykset ja opiskelijoiden tavoitteiden kartoitus

Ok, jatketaan

Lyhenteet

API
Application Programming Interface. Rajapinta, jonka kautta ohjelmat voivat kommunikoida keskenään. Esimerkiksi OpenAI:n API mahdollistaa tekoälyn integroimisen sovelluksiin.

AI
Artificial Intelligence. Kattotermi koneiden kyvylle jäljitellä ihmismäistä älykkyyttä, kuten oppimista ja päätöksentekoa.

DALL·E
OpenAI:n kuvageneraattori, joka tuottaa kuvia tekstikehotteiden perusteella. Nimi on yhdistelmä taiteilija Salvador Dalín ja Pixarin WALL·E-robotin nimistä.

Fine-tuning
Mallin hienosäätö, jossa esikoulutettua kielimallia mukautetaan tiettyyn käyttötarkoitukseen erityisellä koulutusdatalla. Fine-tuning parantaa mallin tarkkuutta tietyissä tehtävissä tai toimialoilla.

Generative
Mallin tarkoitus on tuottaa (eli generoida) uutta tekstiä.

GPT
Generative Pre-trained Transformer.

GUI
Graphical User Interface. Graafinen käyttöliittymä. Visuaalinen tapa olla vuorovaikutuksessa ohjelman kanssa, esimerkiksi napit, kentät ja valikot.

Kielimalli
Algoritmi, joka ennustaa seuraavan sanan tai merkkijonon annetun tekstin perusteella. Suuret kielimallit (LLM:t) oppivat kielen rakenteita valtavien tekstimäärien avulla ja kykenevät tuottamaan luontevaa ja koherenttia tekstiä eri kielillä.

NLP
Natural Language Processing. Luonnollisen kielen käsittely. Tekoälyn ala, joka keskittyy ihmiskielen ymmärtämiseen ja tuottamiseen.

Pre-trained
Malli on esikoulutettu tekstimäärällä ennen kuin sitä sovelletaan tiettyyn tehtävään.

Prompti
Kehote tai syöte, jolla käyttäjä ohjaa tekoälyn tuottamaa sisältöä. Prompti voi olla teksti, kysymys tai kuvaus, joka määrittää tekoälyn tehtävän.

Transformer
Mallin arkkitehtuuri perustuu Transformer-nimiseen neuroverkkorakenteeseen, joka on erittäin tehokas kielitehtävissä.

LLM
Large Language Model. Suuri kielimalli on tekoälymalli, joka on koulutettu valtavilla tekstiaineistoilla ja kykenee tuottamaan, tiivistämään, kääntämään ja analysoimaan tekstiä. Esimerkkejä LLM:istä ovat GPT-4, Claude, Mistral ja LLaMA.

VPS
Virtual Private Server. Virtuaalipalvelin. Käytetään usein omien mallien ajamiseen ilman pilvipalvelun rajoituksia.

UI
User Interface. Käyttöliittymä, joka on osa järjestelmää, jonka kautta käyttäjä on vuorovaikutuksessa ohjelmiston kanssa.

Mikä on Mistral AI?

Tutustutaan:

Mistral AI:
https://mistral.ai/
https://en.wikipedia.org/wiki/Mistral_AI

Europe’s answer to OpenAI launched in 2023. Now it’s worth €6bn:
https://www.thetimes.com/business-money/technology/article/europes-answer-to-openai-launched-in-2023-now-its-worth-6bn-mvsp62l9t?utm_source=chatgpt.com&region=global

1.2 Tekoälyn määritelmä ja rooli yhteiskunnassa

Tekoäly viittaa koneelliseen kykyyn suorittaa tehtäviä, jotka edellyttävät tyypillisesti ihmismäistä ajattelua ja älykkyyttä, kuten päättelyä, oppimista, suunnittelua, lukemista ja luovuutta. Näiden taitojen avulla tekniset järjestelmät voivat havainnoida ympäristöään, käsitellä keräämäänsä tietoa ja tehdä päätöksiä tiettyjen tavoitteiden saavuttamiseksi. Tekoälyjärjestelmät hyödyntävät sekä syötettyä tietoa että erilaisia antureita, kuten kameroita, joiden avulla ne vastaanottavat tietoa ulkomaailmasta. Kerätty tieto käsitellään ja järjestelmä reagoi siihen ohjelmoidun logiikan tai oppimismallin mukaisesti. Joissain tapauksissa järjestelmät kykenevät myös mukauttamaan toimintaansa analysoimalla aikaisempia suorituksiaan, mikä mahdollistaa rajallisen itsenäisen oppimisen ja päätöksenteon. Vaikka tekoälyn perusperiaatteita on hyödynnetty jo 1960-luvulta lähtien, vasta viime vuosina kehitys on ollut erityisen nopeaa. Tähän ovat vaikuttaneet muun muassa laskentatehon kasvu, datan määrän moninkertaistuminen ja uusien tehokkaiden algoritmien käyttöönotto. Nämä tekijät ovat mahdollistaneet merkittäviä edistysaskelia useilla tekoälyn sovellusalueilla. (Euroopan parlamentti 2023).

Tekoäly nähdään keskeisenä osana nyky-yhteiskunnan digitaalista murrosta. Euroopan unionissa se on määritelty yhdeksi strategisista painopistealueista. Ennusteiden mukaan tekoäly tulee jatkossa muuttamaan monia toimialoja perusteellisesti ja vaikutukset näkyvät jo nyt arkipäivän sovelluksissa, kuten älypuhelimissa, verkkopalveluissa ja automatisoiduissa asiakaspalveluratkaisuissa. (Euroopan parlamentti 2023).

Tekoälyteknologiat kehittyvät nopeasti, ja niiden sovellusmahdollisuudet laajenevat eri toimialoille. Tekoäly yleisesti sekä kustomoidut tekoälyratkaisut mahdollistavat organisaatioille, yrityksille ja yksilöille oman toiminnan tehostamisen sekä entistä joustavamman ja tehokkaamman tavan hyödyntää tekoälyä omien tarpeidensa mukaisesti. Lukijan kannattaa harkita myös kustomoidun tekoälyn kehittämistä ja käyttöönottoa eri ympäristöissä, omia tai organisaation tarpeita peilaten. Kurssimateriaaleissa tutustutaan myös kustomoitujen kehotteiden mahdollisuuksiin, GPT-pohjaisen tekoälymallin hyödyntämiseen, API-rajapintojen integrointiin sekä oman tekoälyratkaisun hallinnointiin esikoulutetun mallin avulla. Kurssimateriaaleihin kootun tiedon avulla tutustut eri toteuttamistapoihin ja opit hyödyntämään niin tekoälyä kuin tekoälyn kustomoinnin tuomia mahdollisuuksia entistä tehokkaammin. Erilaisia suuriin kielimalleihin ja koneoppimiseen perustuvia generatiivisen tekoälyn sovelluksia löytyy internetistä tuhansia. Tämän kurssin suoritettuasi kykenet periaatteessa hallitsemaan mitä tahansa luonnolliseen vuorovaikutukseen perustuvaa tekoälyä. (JS 2025).

Tekoäly yleisesti

Viimeksi kuluneiden vuosien aikana tekoäly (artificial intelligence, AI) on saanut paljon julkisuutta ja tullut osaksi jokapäiväistä arkeamme. Meistä useimmilla on käytössään älypuhelin, joka osaa esimerkiksi lajitella valokuvia niiden sisältämän tiedon perusteella. Puhelimissa on myös digitaalisia avustajia (Siri, Google Assistant), jotka ymmärtävät äänikomentoja ja osaavat antaa vastauksia ihmisen kaltaisella äänellä. Viihdekäytössä tekoäly osaa suositella musiikkia tai elokuvia sen perusteella mitä henkilö on viimeksi kuunnellut tai katsonut. (JS 2025).

Edelliset esimerkit antavat jo osviittaa siitä, mitä tekoälyllä nykyään tarkoitetaan. Eräs määritelmä tekoälylle onkin "tietojenkäsittelyn osa-alue, joka pyrkii luomaan älykkäitä koneita, jotka toimivat ja reagoivat kuten ihmiset". Tämän myötä tekoäly pyrkii matkimaan ihmisen toimintaa eli

tekemään päätöksiä käytettävissä olevan tiedon (datan) perusteella
kommunikoi
tunnistaa toistuvia rakenteita ja kaavamaisuuksia
muistaa aiempia tapahtumia
sopeutuu uusiin tilanteisiin

Ihmiseen verrattuna tekoäly on kuitenkin monessa mielessä etevämpi:

se ei väsy
se on ihmistä tarkempi
se on ihmistä nopeampi
ei anna tunteiden vaikuttaa päätöksen tekoon (tämä on sekä hyvä että huono piirre)
tuottaa johdonmukaisia tuloksia

Vaikka tekoäly on noussut yleiseen keskusteluun vahvasti viime aikoina, niin se ei kuitenkaan ole laisinkaan uusi keksintö. Yleisesti tekoälyn varhaiset vaiheet voidaan jäljittää ensimmäisten digitaalisten tietokoneiden syntyhetkiin (ENIAC, 1940-luku). Tietokoneet olivat, ja ovat edelleen, pohjimmiltaan laskukoneita, jotka kykenevät laskemaan yhteen- ja kertolaskua numeroilla nopeasti ja virheettömästi. Tämän varsin yksinkertaisen tehtävän lisäksi niille alettiin miettiä korkeatasoisempia sovelluksia jo hyvin varhain. (Metropolia 2024).

Tekoälyn merkkipaaluja:

1950	Alan Turing kirjoittaa artikkelin: "Can machines think?" (Osaavatko koneet ajatella?). Hän muotoilee myös nk. Turingin testin, jonka läpäisevää tekoälyä voitaisiin perustellusti pitää aitona tekoälynä. Elokuva "Imitation Game" kuvaa Turingin elämää suurelle yleisölle.
1956	John McCarthy ottaa käyttöön termin "Artificial Intelligence".
1959	Arthur Samuel ottaa käyttöön termin "Machine learning" (koneoppiminen)
1960	Ensimmäinen teollisuusrobotti "Unimate" (General Motors)
1961	ELIZA, ensimmäinen chatbot
1961-1995	Useita "AI-talvi" -kausia (vrt. ydintalvi, nuclear winter).Näinä ajanjaksoina tekoälyyn kohdistui vähemmän mielenkiintoa ja panostuksia, joka johtui alkuinnostuksen jälkeisistä lukuisista pettymyksistä tekoälyä kohtaan.
1997	IBM:n DeepBlue-shakkitietokone voittaa maailmanmestari Garri Kasparovin
2005	Itseajavien autojen Darpa-kilpailu perustetaan
2011	IBM:n Watson-järjestelmä voitaa televisioidun Jeopardy-tietokilpailun. Neuroverkko päihittää ihmisen liikennemerkkien tunnistamisessa.
2014	Chatbot "Eugene Goostman" läpäisee Turingin testin.
2018	Google Duplex-avustaja käy puhelinkeskusteluja ihmisen kanssa ja varaa mm. parturiajan, kts. https://www.youtube.com/watch?v=D5VN56jQMWM
2020	DeepFake-teknologia tekee läpimurron ollen keinotekoinen tapa tuottaa kuvaa ja ääntä muistuttaen julkisuuden henkilöitä. https://www.youtube.com/watch?v=iyiOVUbsPcM
2022	ChatGPT tulee julkisesti saataville luomaan tekstisisältöjä ja käymään tekstipohjaisia keskusteluja.

Tekoäly jaotellaan yleisesti alla olevan kuvan mukaisesti. Keskeinen osa tekoälyä on koneoppiminen (machine learning, ML). Siinä kone oppii data-aineistosta tekemään esim. luokitteluja erityisen opetusaineiston perusteella. Hienostunein osa koneoppimista on syväoppiminen (deep learning, DL), joka käyttää oppimiseen neuroverkkoja (neural networks, neural nets). (Metropolia 2024).

Koneoppiminen

Koneoppiminen (machine learning) on tekoälyn osa-alue, jossa tietokoneet oppivat aiemmasta datasta enemmän tai vähemmän automaattisesti. Koneoppiminen pohjautuu matemaattisiin ja tilastollisiin malleihin, joiden avulla kone pystyy tekemään ennusteita (prediction, forecast) historiatiedon nojalla.

Koneoppimisen sovelluksia

puheentunnistus
kuvantunnistus
tekstin tunnistus
roskapostin suodattaminen
suosittelujärjestelmät (mm. Netflix, Spotify)

Koneoppimisjärjestelmää voi verrata pieneen vauvaan, joka kokeilemalla pian huomaa, että muovailuvaha maistuu pahalta kun taas maito maistuu hyvältä. Vastaavasti, kone yhdistelee aiempia tietoja (dataa) toimiakseen paremmin jatkossa. (Metropolia 2024).

Koneoppiminen on erittäin datavetoista ja se haastaakin perinteistä ohjelmointia osaavat henkilöt ajattelemaan uudella tavalla.

Perinteisessä ohjelmointityössä ohjelmoija kirjoittaa sääntöjä (komentolauseet, ehtolauseet, valintarakenne,...) ja antaa datan ohjelmalle. Ohjelma tuottaa näiden perusteella vastauksia. Tämä on ns. determinististä toimintaa; samat vastaukset samalla datalla joka kerta.

Koneoppiminen kääntää tilanteen osittain päinvastaiseksi. Ohjelman sijaan puhutaan mallista (model), jonka tehtävänä on tuottaa sääntöjä. Näitä sääntöjä voidaan soveltaa uuteen dataan tekemään ennusteita juuri sille datalle.

Niinpä koneoppivaa järjestelmää ei varsinaisesti ohjelmoida perinteisessä mielessä vaan puhutaan opettamisesta tai sovittamisesta (training, fitting). Opettaminen tarkoittaa sitä, että koneelle annetaan käyttöön tehtävään sopivia esimerkkiaineistoja. Koneen tehtävänä on löytää tilastolliset säännöt näistä esimerkeistä. Sanotaan, että malli sovitetaan vastaamaan dataa.

Esimerkiksi kuvantunnistustehtävässä opetusaineisto koostuu isosta joukosta kuvia, joihin on liitettu tunnisteet (label, tag)

meri, ranta, Malediivit

talvi, lumi, huippu, vuori

vesi, ranta, meri, aallot

(Kuvien lähde: PixaBay)

Tekstintunnistamisen yhteydessä opetusaineisto koostuisi tekstinpätkistä ja niihin liitetyistä tunnisteista, esim.

"Palvelu oli ystävällistä"	POS
"Keitossa ui kärpänen"	NEG

(Metropolia 2024).

Klassinen esimerkki kuvantunnistamiseen liittyen on kuuluisa MNIST-aineisto https://en.wikipedia.org/wiki/MNIST_database

Se on joukko kuvia käsinkirjoitetuista numeroista 0-9. Kuhunkin kuvaan on liitetty numeraalinen tieto niiden esittämästä numerosta.

(Kuvalähde: Wikipedia Commons)

Tällaisen opetusaineiston hyödyntämisen jälkeen koneoppimisjärjestelmää oppi tunnistamaan käsinkirjoitettuja numeroita.

Koneoppivien järjestelmien yleistyminen on nojannut kahteen teknologiseen edistyaskeleeseen:

laskentatehon voimakas kasvu (CPU, GPU, muisti)
digitaalisen aineiston määrän lisääntyminen (kuvat, tekstit, äänet,...)

Nämä molemmat tekijät ovat yhdessä mahdollistaneet monet nykyiset tekoälysovellukset.

Koneoppiminen jaotellaan kolmeen eri tyyppiin toimintaperiaatteen mukaan.

Ohjattu oppiminen (supervised learning)
- "opettajan johdolla oppimista"
- järjestelmälle annetaan data ja tunnisteet (kts. yllä)
- järjestelmä oppii tuottamaan tunnisteita uudelle datalle, jota se ei ole koskaan nähnyt
Ohjaamaton oppiminen (unsupervised learning)
- "itsenäistä oppimista"
- järjestelmälle annetaan data ilman tunnisteita
- järjestelmän täytyy itse kyetä löytämään toistuvia rakenteita ja samankaltaisuuksia datasta
- esim. asiakassegmentointi markkinoinnissa eli ostajien ryhmittely samankaltaisten joukkoihin
- tekniikkana klusterointi (clustering)
- soveltuu monimutkaisiin ongelmiin, joihin on vaikeaa tai mahdotonta hankkia tunnisteilla varustettua dataa. Voi toimia, vaikka emme tiedä mitä olemme etsimässä; kone löytää itse rakenteita.
Vahvistettu oppiminen (reinforcement learning)
- ei lainkaan opetusaineistoa
- järjestelmä koostuu ympäristöstä (environment), jossa toimija (agent) toimii
- järjestelmää antaa toimijalle palautetta sen toimintojen perusteella ("keppiä" tai "porkkanaa")
- toimija pyrkii maksimoimaan porkkanan (tai minimoimaan kepin) ja oppimaan siihen suuntaan
- esim. peli-AI (Pacman, pong)

https://www.youtube.com/watch?v=QilHGSYbjDQ

Syväoppiminen

Syväoppiminen neuroverkoilla (deep learning, neural network) nousi pinnalle vuoden 2005 tienoilla vastaamaan koneoppimisen silloisiin haasteisiin. Datan mittaluokka (dimensio) kasvoi suureksi ja piirteiden erottaminen (feature extraction) kävi mahdottomaksi tehtävän monimutkaisuuden myötä. Esim. käsinpiirretyistä numeroista/kirjaimista on mahdoton luetella kaikkia viivanpätkien tyyppejä (piirteitä), joita tunnistaminen edellyttää. Syväoppimisessä tämä ongelma on ulkoistettu neuroverkolle, jonka syövereihin tunnistaminen on upotettu.

Syväoppimisen johtoajatus pohjautuu ihmisaivojen rakenteeseen ja toimintaan. Keskiössä on malli aivosolusta (neuronista), jotka ovat järjestäytyneet ja jotka aktivoituvat pienen sähköimpulssin tavoin. Näin ne "välittävät tietoa" toinen toisilleen. (Metropolia 2024).

(Kuvalähde: Wikpedia)

Keinotekoinen neuroni (artificial neuron) saa koneessa syötteenä (input) lukuja. Yhdessä painokertoimien (weights) kanssa se koostaa syötteistä painotetun keskiarvon ja lisää tulokseen bias-luvun. Tämä kooste välitetään aktivointifunktiolle (activation function), jonka tulos (output) määrää aktivoituuko neuroni vai ei. (Metropolia 2024).

(Kuvalähde: Wikipedia)

Aktivointifunktion tulos on numero lukujen 0 ja 1 väliltä. Niinpä se voidaan tulkita todennäköisyydeksi siitä aktivoituuko neuroni. Bias-luku kontrolloi sitä, kuinka suuren painotetun keskiarvon tulee olla, jotta neuroni aktivoituu. (Metropolia 2024).

Aktivointifunktioita on muutamaa eri perustyyppiä, jotka poikkeavat toisistaan siinä, miten jyrkästi ne nousevat arvosta 0 arvoon 1.

Sigmoid-funktio Relu-funktio (rectified linear unit) Askelfunktio

Keinotekoinen neuroverkko (artificial neural network, ANN) koostuu sadoista tai tuhansista neuroneista, jotka on järjestetty kerrosmaiseen rakenteeseen. Tämä tunnetaan myös nimellä Multilayer Perceptron (MLP).

Verkossa tieto etenee vasemmalla olevalta syötekerrokselta kohti oikealla olevaa tuloskerrosta. Syötekerroksen (input layer) ja tuloskerroksen (output layer) välissä on yksi tai useampi piilotettu kerros (hidden layer, kuvassa sinisellä). Mikäli piilotettuja kerroksia on enemmän kuin yksi, niin puhutaan syvästä verkosta (deep network). Yllä oleva verkko on nk. eteenpäin syöttävä (feedforward).

Neuronit ovat kytketty toisiinsa eri tavoin. Yllä olevan kuvan mustat viivat kuvaavat sitä, että tässä tilanteessa verkko on täysin kytketty (fully connected), sillä kunkin kerroksen neuronit on kytketty jokaiseen seuraavan kerroksen neuroniin. Kytkentätapoja on kuitenkin muitakin. Jokaiseen mustaan viivaan eli kytkökseen liittyy omat painokertoimet ja jokaisella neuronilla on oma bias-lukunsa. Kuvan tilanteessa on siis 15 bias-lukua ja 76 painokerrointa. Nämä 91 parametria täytyy säätää optimaalisesti opetuksen yhteydessä, jotta verkko toimii hyvin. Käytännössä verkot ovat paljon suurempia, jolloin myös säädettävien parametrien määrä kasvaa helposti jopa satoihin tuhansiin. Tämä vaatii paljon prosessointitehoa ja siten aikaa verkon opetusvaiheessa.

Verkon opettaminen on tässä ohjattua oppimista. Syötekerrokseen syötetään yksi kerrallaan numerosarjoja (esim. digikuvat tai tekstinpätkät voidaan esittää koneessa numerosarjoina, viime kädessä nollina ja ykkösinä). Kuvan tunniste tiedetään eli verkon tulisi tuottaa tietty tunniste tuloskerroksessa. Bias-luvut ja painokertoimet säädetään lopusta alkuun päin nk. backpropagation-algoritmilla, joka siis kulkee kerros kerrallaan oikealta vasemmalle päin.

Karkeasti voidaan ajatella, että kunkin kerroksen vastuulla on oppia tunnistamaan yksi piirre (feature) syötteestä. Lisäämällä verkkoon lisää piilotettuja kerroksia on kohtuullista odottaa, että verkko kykenee suoriutumaan monimutkaisemmasta tehtävästä.

Syvän neuroverkon huono puoli on kuitenkin sen huono tulkittavuus. Verkko on viime kädessä vain pitkä lista painokertoimia ja bias-lukuja, joita tuijottamalla ihmisen on mahdotonta selittää miksi verkko toimii. Se vain toimii. Tällä voi olla kuitenkin haitallisia vaikutuksia oikeudellisessa mielessä. Esim. itseajavissa autoissa vastuukysymykset ovat hankalia; väistääkö auto jalankulkijaa, jos se saattaa matkustajan vaaraan, ja kuka vastaa tästä päätöksestä? Vastaavasti automatisoiduissa lainapäätöksissä ei aina kyetä perustelemaan miksi neuroverkko teki kielteisen päätöksen.

(Metropolia 2024).

Generatiivinen tekoäly

Generatiivinen tekoäly eroaa edellä kuvatuista tekoälyn alatyypeistä siinä mielessä, että sen tehtävänä on tuottaa uutta digitaalista sisältöä. Tekoälyä on perinteisesti käytetty luokittelemaan tai ryhmittelemään dataa (esim. roskapostin luokittelu, kuvan luokittelu, asiakkaiden ryhmittely). Generatiivinen tekoäly sen sijaan pyrkii tuottamaan kokonaan uutta dataa, esim. kuvaa, tekstiä, ääntä tai videota.

Generatiivinen AI on silti koneoppimista, jossa kone oppi tuottamaan jotain uutta ja alkuperäistä saaden mallia ja innoitusta opetusaineistosta. Esimerkiksi maalauksellisen kuvan tai vaikkapa runonpätkän tuottaminen voidaan tehdä generatiivisella tekoälyllä. Tekoälylle annetaan näissä tapauksissa opetusaineistona joukko maalauksia tai runoja ja kone omaksuu niistä relevantteja tyylejä kyeten luomaan sen pohjalta täysin uusia teoksia.

Historiallisesti ensimmäisenä generatiivisen tekoälyn sovelluksena voidaan pitää chatbotteja, joiden alkuperä juontuu 1960-luvulle. Jo silloin chatbotit tuottivat luonnollisen kielen tekstisisältöjä ja ne ovat edelleenkin laajalti käytössä.

Suureen suosioon generatiivinen tekoäly nousi kuitenkin 2014 nk. GAN-verkkojen myötä (Generative Adversarial Network), jotka kykenivät luomaan todentuntuista kuvaa, ääntä ja videota ihmisistä. Parhaita esimerkkejä tästä on tätä nykyä verkkosivu https://thispersondoesnotexist.com/ joka luo kasvokuvia ihmisistä, joita ei ole olemassa.

(Metropolia 2024).

(Kuvalähde: thispersondoesnotexist.com AI-generoitu)

Vielä vaikuttavampi saavutus generatiivisen tekoälyn saralla on nk. deep fake-videot, joissa julkisuuden henkilöt joutuvat erilaisiin keinotekoisiin tilanteisiin tai äänisyntetisaattori, jossa maailman johtajat puhuvat heidän suuhun kirjaimellisesti laitettuja sanoja. kts.

(Kuvalähde: Youtube)

https://www.youtube.com/watch?v=iyiOVUbsPcM

(Kuvalähde: Youtube)

https://www.youtube.com/watch?v=cQ54GDm1eL0

Myöhemmin tässä materiaalissa kohdattavat suuret kielimallit yhdistettynä generatiiviseen tekoälyyn ovat mahdollistaneet nykypäivän huippusovellukset kuten ChatGPT ja DALL-E.

Generatiivinen tekoäly kattaa tänä päivänä koko joukon muitakin mahdollisia sovelluksia.

asiakaspalvelun chatbotit
aidonnäköiset kuvat julkisuuden henkilöistä
elokuvien jälkiäänitykset (dubbaus) näyttelijän ääntä matkimalla
sähköpostien kirjoituttaminen tekoälyllä
laadukkaiden digikuvien tuottaminen
piirisuunnittelun tehostaminen jne.

Yllä olevasta listasta voidaan havaita, että generatiivista tekoälyä (kuten kaikkea teknologiaa!) voidaan käyttää sekä hyvään että pahaan. Sillä voidaan tehostaa tai jopa kokonaan automatisoida kirjoittamiseen liittyviä työvaiheita mutta sillä on myös mahdollista levittää misinformaatiota (fake news) kuulijan sitä lainkaan tietämättä.

(Metropolia 2024).

Kielimallit, historia

Kielimalli (language model) on koneoppimismalli, joka yksinkertaistaen ennustaa seuraavaa sanaa jonossa sanoja. Tarkastellaan esimerkiksi lauseen alkua

"The core idea in machine learning is its ability to"

Malli voisi ehdottaa seuraavaksi sanaksi joitain seuraavista vastaavine todennäköisyyksineen

detect	2,2%
identify	2,5%
find	2,8%
learn	5.3%
predict	13,2%

(Nämä sanat ja todennäköisyydet on saatu oikeasta toimivasta GPT2-mallista Wolfram Language -ohjelmointiympäristössä https://resources.wolframcloud.com/NeuralNetRepository/resources/GPT2-Transformer-Trained-on-WebText-Data/ )

Taulukon sanat ovat mallin mielestä järkevimmät tavat jatkaa lausetta. Malli ottaa huomioon asiayhteyden eli aiemmat sanat, niiden merkityksen ja kuinka ne liittyvät toisiinsa. Tämän ymmärryksen malli on saanut käytyään läpi opetusvaiheessa valtavan määrän (digitaalisia) tekstiaineistoja; verkkosivuja, kirjoja jne.

Kun ChatGPT kirjoittaa esimerkiksi esseetä, niin se itse asiassa jatkaa sana kerrallaan jostain (satunnaisesta) aloituskohdasta liikkeelle lähdettyään. Kuitenkaan aina ei kannata valita kaikkein todennäköisintä sanaa, koska se voisi johtaa toisteiseen tekstiin ja ei vaikuttaisi ihmisen luomukselta. Toisaalta, valitsemalla vähemmän todennäköisen sanan teksti saa omanlaistaan mielenkiintoa.

Seuraavan sanan valintaan liittyy siis aina tiettyä satunnaisuutta (epävarmuutta) ja sen vuoksi samalla lauseenaloituksella saa eri kerroilla eri jatkeen. Tämä nähdään myöhemmin konkreettisesti ChatGPT:n käytön yhteydessä.

Tämän lisäksi kielimallilla on tietoa kieliopista eli se osaa yhdistää verbejä, substantiiveja ja pronomineja luonnollisella tavalla ja se tietää mitkä sanat esiintyvät usein yhdessä.

Edellistä esimerkkiä voidaan jatkaa valitsemalla toistuvasti seuraava "sana" eli jatkamalla lausetta sana kerrallaan:

Huomaa, että tässä "sana" voi tarkoittaa myös välimerkkiä (piste, pilkku,...). Näin saadaan useista virkkeistä koostuvia kokonaisuuksia tuotettua.

(Metropolia 2024).

GPT-mallien toiminta

GPT on lyhenne sanoista Generative Pre-trained Transformers. Kyseessä on koneoppimismalli, joka perustuu takaisinkytkeytyviin neuroverkkoihin (RNN, Recurrent Neural Network).

RNN-verkossa jokaisella neuronilla on oma takaisinkytkentänsä, joka tarjoaa neuronilla sisäisen muistin. Muistin avulla neuroni voi ottaa huomioon aiemmat opit ja kykenee huomioimaan ajallisen järjestyksen. Esim. syötteen "neuroni" saadessaan RNN-verkko voi kirjainta "r" käsitellessään huomioda kirjaimet "n", "e" ja "u".

Sama perusperiaate on läsnä myös nk. Fibonaccin lukujonossa 1,2,3,5,8,13,... jossa jokainen luku on kahden edellisen luvun summa. Tällainen käsittely vaatii edellisten tietojen muistamista ja havainnoimista.

Eteenpäin syöttävä verkko unohtaa aiemmat syötteet heti ne käsiteltyään. Tämä verkkotyyppien välinen ero tekee RNN-verkoista erinomaisesti soveltuvan jonomaisen datan käsittelyyn.

Generative ("generoiva")

Syötejonon jatkamista uudella tiedolla. Esim. jatka numerosarjaa 1,3,5,7,9,...

Kielimallien yhteydessä tämä tarkoittaa sanajonon jatkamista, ja vieläpä tarkemmin, luonnollisen kielen pätkän jatkamista. (Metropolia 2024).

Pre-trained ("esiopetettu")

Esiopettaminen on kaksivaiheista. Ensin malli opetetaan valtavalla datamäärällä ja sitten se hienosäädetään tiettyyn erikoistarkoitukseen. GPT:n tapauksessa tämä tarkoittaa ensin tekstiaineistolla opettamista ja sitten räätälöimistä esim. tekstin kääntämiseen, kysymyksiin vastaamiseen tai yhteenvetojen tekemiseen. Hienosäätövaiheessa malli siis sopeutuu johonkin tiettyyn tehtävään toimiakseen siinä mahdollisimman hyvin. (Metropolia 2024).

Transformer ("muunnin")

Muunnin osaa käsitellä jonomaista dataa, esim. sanoja, kuvia tai ääntä. Neuroverkossa muunnin mahdollistaa verkon kerrosten ottamaan huomioon myös verkon muut kerrokset. Tämän myötä malli voi antaa syötejonon eri osille eri tavalla huomiota ("attention"). Esim. syötejonossa (Metropolia 2024).

"Maalari maalaa taloa"

malli voi keskittyä seuraavaa sanaa valitessaan joko sanaan "maalaa" tai "taloa" tilanteen mukaan. Tulos voisi olla joko

"Maalari maalaa taloa punaiseksi." tai

"Maalari maalaa taloa innokkaasti".

Huomaa mihin viimeinen sana on jonossa liitetty. (Metropolia 2024).

Mistral AI:n mallit: https://docs.mistral.ai/getting-started/models/models_overview/

Mistral AI:n käyttöehdot ja tietosuojakäytäntö:

Terms of Service:
https://mistral.ai/terms#terms-of-service

Privacy Policy
https://mistral.ai/terms#privacy-policy

Tehtävä: Mistral AI:n käyttöönotto

Seuraavaksi tehtävänäsi on ottaa käyttöön MistralAI.

Luo tunnukset https://chat.mistral.ai/chat?q=

Kuittaa tehdyksi

Kuittaa tehtävä tehdyksi palauttamalla Merkintä: "Tehty".

Palauta kuva tai muu tiedosto
Palauta merkintä
Palauta linkki
Palauta äänitallenne

Sinulla ei ole tarvittavia oikeuksia lähettää mitään.

Ensimmäinen tehtäväsi: Kääntäminen

Ensimmäinen tehtäväsi on kokeilla suomentamista! Tämä ei vaadi muuta kuin "zero shot" -promptia:

Kirjoita Mistral AI:n kehotekenttään "Suomenna:", sitten avaa seuraavat linkit ja kopioi tekstit sieltä.

Kopioi kaikki tekstit:

https://mistral.ai/terms#terms-of-service

Tulosteena saat suomennoksen!

Tehtävää ei tarvitse palauttaa, mutta suomennokseen kannattaa perehtyä ja lukea se ajatuksen kanssa läpi.

Kuittaa tehdyksi

Kuittaa tehtävä tehdyksi palauttamalla Merkintä: "Tehty".

Palauta kuva tai muu tiedosto
Palauta merkintä
Palauta linkki
Palauta äänitallenne

Sinulla ei ole tarvittavia oikeuksia lähettää mitään.