Tekoälymoduuli: Tekoäly opiskelijan apuna
Johdanto ChatGPT:hen ja sen käyttöliittymään

ChatGPT. Perehdytys tekoälyyn ja ilmaisversion käyttöön
ChatGPT on ilmainen käyttää, tätä kirjoitettaessa versiona on 4o
Tässä moduulissa tutustumme tekoälyyn teorian muodossa ja käytännön muodossa opettelemme, kuinka löydämme sivuston, kuinka luomme tilin ja kirjaudumme sisään sekä syötämme ensimmäisen kysymyksen ChatGPT:lle. Ilmaisversiossa kysymysten rajat eivät tule kovinkaan nopeasti vastaan, joten voit huoletta tutkia ChatGPT:tä ja esittää sillä kysymyksiä. Maksullisen version ostamista ei tällä kurssilla tarvita eikä suositella. Tällä kurssilla käytetään ChatGPT:n ilmaisversiota. Kun hallitset ilmaisversion toiminnot, saatat kokea tarpeelliseksi maksullisen version käytön sen tiettyjen eroavaisuuksien ansiosta. Opitaan nyt ensin käyttämään ilmaisversiota, sillä jo pelkästään se on kykenevä varsin moneen!
Tervetuloa tutustumaan ChatGPT 4o:n maailmaan, jossa tekoälyn avulla luodaan vuoropuhelua ihmisen ja koneen välille. Tässä oppaassa käymme läpi, kuinka voit aloittaa keskustelun ChatGPT:n kanssa, hyödyntää sen ominaisuuksia, ja miten voit parhaiten käyttää tätä työkalua hyödyksesi.
Mikä on ChatGPT?
ChatGPT on tekoälyyn pohjautuva chatbot, jonka on kehittänyt OpenAI. Se käyttää kehittynyttä luonnollisen kielen käsittelyn teknologiaa tarjotakseen käyttäjilleen vuorovaikutteisen ja mukautuvan keskustelukokemuksen. ChatGPT pystyy tuottamaan inhimillisen kaltaisia vastauksia monenlaisiin kysymyksiin ja aiheisiin, mukaan lukien yleistieto, opetus, ohjeiden antaminen, ja jopa luova kirjoittaminen.
Tekoäly yleisesti
Viimeksi kuluneiden vuosien aikana tekoäly (artificial intelligence, AI) on saanut paljon julkisuutta ja tullut osaksi jokapäiväistä arkeamme. Meistä useimmilla on käytössään älypuhelin, joka osaa esimerkiksi lajitella valokuvia niiden sisältämän tiedon perusteella. Puhelimissa on myös digitaalisia avustajia (Siri, Google Assistant), jotka ymmärtävät äänikomentoja ja osaavat antaa vastauksia ihmisen kaltaisella äänellä. Viihdekäytössä tekoäly osaa suositella musiikkia tai elokuvia sen perusteella mitä henkilö on viimeksi kuunnellut tai katsonut.
Edelliset esimerkit antavat jo osviittaa siitä, mitä tekoälyllä nykyään tarkoitetaan. Eräs määritelmä tekoälylle onkin "tietojenkäsittelyn osa-alue, joka pyrkii luomaan älykkäitä koneita, jotka toimivat ja reagoivat kuten ihmiset". Tämän myötä tekoäly pyrkii matkimaan ihmisen toimintaa eli
- tekemään päätöksiä käytettävissä olevan tiedon (datan) perusteella
- kommunikoi
- tunnistaa toistuvia rakenteita ja kaavamaisuuksia
- muistaa aiempia tapahtumia
- sopeutuu uusiin tilanteisiin
Ihmiseen verrattuna tekoäly on kuitenkin monessa mielessä etevämpi:
- se ei väsy
- se on ihmistä tarkempi
- se on ihmistä nopeampi
- ei anna tunteiden vaikuttaa päätöksen tekoon (tämä on sekä hyvä että huono piirre)
- tuottaa johdonmukaisia tuloksia
Vaikka tekoäly on noussut yleiseen keskusteluun vahvasti viime aikoina, niin se ei kuitenkaan ole laisinkaan uusi keksintö. Yleisesti tekoälyn varhaiset vaiheet voidaan jäljittää ensimmäisten digitaalisten tietokoneiden syntyhetkiin (ENIAC, 1940-luku). Tietokoneet olivat, ja ovat edelleen, pohjimmiltaan laskukoneita, jotka kykenevät laskemaan yhteen- ja kertolaskua numeroilla nopeasti ja virheettömästi. Tämän varsin yksinkertaisen tehtävän lisäksi niille alettiin miettiä korkeatasoisempia sovelluksia jo hyvin varhain. (Metropolia 2024).
Tekoälyn merkkipaaluja:
1950 |
Alan Turing kirjoittaa artikkelin: "Can machines think?" (Osaavatko koneet ajatella?). Hän muotoilee myös nk. Turingin testin, jonka läpäisevää tekoälyä voitaisiin perustellusti pitää aitona tekoälynä. Elokuva "Imitation Game" kuvaa Turingin elämää suurelle yleisölle. |
1956 | John McCarthy ottaa käyttöön termin "Artificial Intelligence". |
1959 | Arthur Samuel ottaa käyttöön termin "Machine learning" (koneoppiminen) |
1960 | Ensimmäinen teollisuusrobotti "Unimate" (General Motors) |
1961 | ELIZA, ensimmäinen chatbot |
1961-1995 |
Useita "AI-talvi" -kausia (vrt. ydintalvi, nuclear winter).Näinä ajanjaksoina tekoälyyn kohdistui vähemmän mielenkiintoa ja panostuksia, joka johtui alkuinnostuksen jälkeisistä lukuisista pettymyksistä tekoälyä kohtaan. |
1997 |
IBM:n DeepBlue-shakkitietokone voittaa maailmanmestari Garri Kasparovin |
2005 |
Itseajavien autojen Darpa-kilpailu perustetaan |
2011 |
IBM:n Watson-järjestelmä voitaa televisioidun Jeopardy-tietokilpailun. Neuroverkko päihittää ihmisen liikennemerkkien tunnistamisessa. |
2014 |
Chatbot "Eugene Goostman" läpäisee Turingin testin. |
2018 |
Google Duplex-avustaja käy puhelinkeskusteluja ihmisen kanssa ja varaa mm. parturiajan, kts. https://www.youtube.com/watch?v=D5VN56jQMWM |
2020 |
DeepFake-teknologia tekee läpimurron ollen keinotekoinen tapa tuottaa kuvaa ja ääntä muistuttaen julkisuuden henkilöitä. https://www.youtube.com/watch?v=iyiOVUbsPcM |
2022 |
ChatGPT tulee julkisesti saataville luomaan tekstisisältöjä ja käymään tekstipohjaisia keskusteluja. |
Tekoäly jaotellaan yleisesti alla olevan kuvan mukaisesti. Keskeinen osa tekoälyä on koneoppiminen (machine learning, ML). Siinä kone oppii data-aineistosta tekemään esim. luokitteluja erityisen opetusaineiston perusteella. Hienostunein osa koneoppimista on syväoppiminen (deep learning, DL), joka käyttää oppimiseen neuroverkkoja (neural networks, neural nets). (Metropolia 2024).
Koneoppiminen (machine learning) on tekoälyn osa-alue, jossa tietokoneet oppivat aiemmasta datasta enemmän tai vähemmän automaattisesti. Koneoppiminen pohjautuu matemaattisiin ja tilastollisiin malleihin, joiden avulla kone pystyy tekemään ennusteita (prediction, forecast) historiatiedon nojalla.
Koneoppimisen sovelluksia
- puheentunnistus
- kuvantunnistus
- tekstin tunnistus
- roskapostin suodattaminen
- suosittelujärjestelmät (mm. Netflix, Spotify)
Koneoppimisjärjestelmää voi verrata pieneen vauvaan, joka kokeilemalla pian huomaa, että muovailuvaha maistuu pahalta kun taas maito maistuu hyvältä. Vastaavasti, kone yhdistelee aiempia tietoja (dataa) toimiakseen paremmin jatkossa. (Metropolia 2024).
Koneoppiminen on erittäin datavetoista ja se haastaakin perinteistä ohjelmointia osaavat henkilöt ajattelemaan uudella tavalla.
Perinteisessä ohjelmointityössä ohjelmoija kirjoittaa sääntöjä (komentolauseet, ehtolauseet, valintarakenne,...) ja antaa datan ohjelmalle. Ohjelma tuottaa näiden perusteella vastauksia. Tämä on ns. determinististä toimintaa; samat vastaukset samalla datalla joka kerta.
Koneoppiminen kääntää tilanteen osittain päinvastaiseksi. Ohjelman sijaan puhutaan mallista (model), jonka tehtävänä on tuottaa sääntöjä. Näitä sääntöjä voidaan soveltaa uuteen dataan tekemään ennusteita juuri sille datalle.
Niinpä koneoppivaa järjestelmää ei varsinaisesti ohjelmoida perinteisessä mielessä vaan puhutaan opettamisesta tai sovittamisesta (training, fitting). Opettaminen tarkoittaa sitä, että koneelle annetaan käyttöön tehtävään sopivia esimerkkiaineistoja. Koneen tehtävänä on löytää tilastolliset säännöt näistä esimerkeistä. Sanotaan, että malli sovitetaan vastaamaan dataa.
Esimerkiksi kuvantunnistustehtävässä opetusaineisto koostuu isosta joukosta kuvia, joihin on liitettu tunnisteet (label, tag)
meri, ranta, Malediivit
talvi, lumi, huippu, vuori
vesi, ranta, meri, aallot
(Kuvien lähde: PixaBay)
Tekstintunnistamisen yhteydessä opetusaineisto koostuisi tekstinpätkistä ja niihin liitetyistä tunnisteista, esim.
"Palvelu oli ystävällistä" | POS |
"Keitossa ui kärpänen" | NEG |
(Metropolia 2024).
Klassinen esimerkki kuvantunnistamiseen liittyen on kuuluisa MNIST-aineisto https://en.wikipedia.org/wiki/MNIST_database
Se on joukko kuvia käsinkirjoitetuista numeroista 0-9. Kuhunkin kuvaan on liitetty numeraalinen tieto niiden esittämästä numerosta.
(Kuvalähde: Wikipedia Commons)
Tällaisen opetusaineiston hyödyntämisen jälkeen koneoppimisjärjestelmää oppi tunnistamaan käsinkirjoitettuja numeroita.
Koneoppivien järjestelmien yleistyminen on nojannut kahteen teknologiseen edistyaskeleeseen:
- laskentatehon voimakas kasvu (CPU, GPU, muisti)
- digitaalisen aineiston määrän lisääntyminen (kuvat, tekstit, äänet,...)
Nämä molemmat tekijät ovat yhdessä mahdollistaneet monet nykyiset tekoälysovellukset.
Koneoppiminen jaotellaan kolmeen eri tyyppiin toimintaperiaatteen mukaan.
- Ohjattu oppiminen (supervised learning)
- "opettajan johdolla oppimista"
- järjestelmälle annetaan data ja tunnisteet (kts. yllä)
- järjestelmä oppii tuottamaan tunnisteita uudelle datalle, jota se ei ole koskaan nähnyt
- Ohjaamaton oppiminen (unsupervised learning)
- "itsenäistä oppimista"
- järjestelmälle annetaan data ilman tunnisteita
- järjestelmän täytyy itse kyetä löytämään toistuvia rakenteita ja samankaltaisuuksia datasta
- esim. asiakassegmentointi markkinoinnissa eli ostajien ryhmittely samankaltaisten joukkoihin
- tekniikkana klusterointi (clustering)
- soveltuu monimutkaisiin ongelmiin, joihin on vaikeaa tai mahdotonta hankkia tunnisteilla varustettua dataa. Voi toimia, vaikka emme tiedä mitä olemme etsimässä; kone löytää itse rakenteita.
- Vahvistettu oppiminen (reinforcement learning)
- ei lainkaan opetusaineistoa
- järjestelmä koostuu ympäristöstä (environment), jossa toimija (agent) toimii
- järjestelmää antaa toimijalle palautetta sen toimintojen perusteella ("keppiä" tai "porkkanaa")
- toimija pyrkii maksimoimaan porkkanan (tai minimoimaan kepin) ja oppimaan siihen suuntaan
- esim. peli-AI (Pacman, pong)
https://www.youtube.com/watch?v=QilHGSYbjDQ
Syväoppiminen neuroverkoilla (deep learning, neural network) nousi pinnalle vuoden 2005 tienoilla vastaamaan koneoppimisen silloisiin haasteisiin. Datan mittaluokka (dimensio) kasvoi suureksi ja piirteiden erottaminen (feature extraction) kävi mahdottomaksi tehtävän monimutkaisuuden myötä. Esim. käsinpiirretyistä numeroista/kirjaimista on mahdoton luetella kaikkia viivanpätkien tyyppejä (piirteitä), joita tunnistaminen edellyttää. Syväoppimisessä tämä ongelma on ulkoistettu neuroverkolle, jonka syövereihin tunnistaminen on upotettu.
Syväoppimisen johtoajatus pohjautuu ihmisaivojen rakenteeseen ja toimintaan. Keskiössä on malli aivosolusta (neuronista), jotka ovat järjestäytyneet ja jotka aktivoituvat pienen sähköimpulssin tavoin. Näin ne "välittävät tietoa" toinen toisilleen. (Metropolia 2024).
(Kuvalähde: Wikpedia)
Keinotekoinen neuroni (artificial neuron) saa koneessa syötteenä (input) lukuja. Yhdessä painokertoimien (weights) kanssa se koostaa syötteistä painotetun keskiarvon ja lisää tulokseen bias-luvun. Tämä kooste välitetään aktivointifunktiolle (activation function), jonka tulos (output) määrää aktivoituuko neuroni vai ei. (Metropolia 2024).
(Kuvalähde: Wikipedia)
Aktivointifunktion tulos on numero lukujen 0 ja 1 väliltä. Niinpä se voidaan tulkita todennäköisyydeksi siitä aktivoituuko neuroni. Bias-luku kontrolloi sitä, kuinka suuren painotetun keskiarvon tulee olla, jotta neuroni aktivoituu. (Metropolia 2024).
Aktivointifunktioita on muutamaa eri perustyyppiä, jotka poikkeavat toisistaan siinä, miten jyrkästi ne nousevat arvosta 0 arvoon 1.
Sigmoid-funktio Relu-funktio (rectified linear unit) Askelfunktio
Keinotekoinen neuroverkko (artificial neural network, ANN) koostuu sadoista tai tuhansista neuroneista, jotka on järjestetty kerrosmaiseen rakenteeseen. Tämä tunnetaan myös nimellä Multilayer Perceptron (MLP).
Verkossa tieto etenee vasemmalla olevalta syötekerrokselta kohti oikealla olevaa tuloskerrosta. Syötekerroksen (input layer) ja tuloskerroksen (output layer) välissä on yksi tai useampi piilotettu kerros (hidden layer, kuvassa sinisellä). Mikäli piilotettuja kerroksia on enemmän kuin yksi, niin puhutaan syvästä verkosta (deep network). Yllä oleva verkko on nk. eteenpäin syöttävä (feedforward).
Neuronit ovat kytketty toisiinsa eri tavoin. Yllä olevan kuvan mustat viivat kuvaavat sitä, että tässä tilanteessa verkko on täysin kytketty (fully connected), sillä kunkin kerroksen neuronit on kytketty jokaiseen seuraavan kerroksen neuroniin. Kytkentätapoja on kuitenkin muitakin. Jokaiseen mustaan viivaan eli kytkökseen liittyy omat painokertoimet ja jokaisella neuronilla on oma bias-lukunsa. Kuvan tilanteessa on siis 15 bias-lukua ja 76 painokerrointa. Nämä 91 parametria täytyy säätää optimaalisesti opetuksen yhteydessä, jotta verkko toimii hyvin. Käytännössä verkot ovat paljon suurempia, jolloin myös säädettävien parametrien määrä kasvaa helposti jopa satoihin tuhansiin. Tämä vaatii paljon prosessointitehoa ja siten aikaa verkon opetusvaiheessa.
Verkon opettaminen on tässä ohjattua oppimista. Syötekerrokseen syötetään yksi kerrallaan numerosarjoja (esim. digikuvat tai tekstinpätkät voidaan esittää koneessa numerosarjoina, viime kädessä nollina ja ykkösinä). Kuvan tunniste tiedetään eli verkon tulisi tuottaa tietty tunniste tuloskerroksessa. Bias-luvut ja painokertoimet säädetään lopusta alkuun päin nk. backpropagation-algoritmilla, joka siis kulkee kerros kerrallaan oikealta vasemmalle päin.
Karkeasti voidaan ajatella, että kunkin kerroksen vastuulla on oppia tunnistamaan yksi piirre (feature) syötteestä. Lisäämällä verkkoon lisää piilotettuja kerroksia on kohtuullista odottaa, että verkko kykenee suoriutumaan monimutkaisemmasta tehtävästä.
Syvän neuroverkon huono puoli on kuitenkin sen huono tulkittavuus. Verkko on viime kädessä vain pitkä lista painokertoimia ja bias-lukuja, joita tuijottamalla ihmisen on mahdotonta selittää miksi verkko toimii. Se vain toimii. Tällä voi olla kuitenkin haitallisia vaikutuksia oikeudellisessa mielessä. Esim. itseajavissa autoissa vastuukysymykset ovat hankalia; väistääkö auto jalankulkijaa, jos se saattaa matkustajan vaaraan, ja kuka vastaa tästä päätöksestä? Vastaavasti automatisoiduissa lainapäätöksissä ei aina kyetä perustelemaan miksi neuroverkko teki kielteisen päätöksen.
(Metropolia 2024).
Generatiivinen tekoäly eroaa edellä kuvatuista tekoälyn alatyypeistä siinä mielessä, että sen tehtävänä on tuottaa uutta digitaalista sisältöä. Tekoälyä on perinteisesti käytetty luokittelemaan tai ryhmittelemään dataa (esim. roskapostin luokittelu, kuvan luokittelu, asiakkaiden ryhmittely). Generatiivinen tekoäly sen sijaan pyrkii tuottamaan kokonaan uutta dataa, esim. kuvaa, tekstiä, ääntä tai videota.
Generatiivinen AI on silti koneoppimista, jossa kone oppi tuottamaan jotain uutta ja alkuperäistä saaden mallia ja innoitusta opetusaineistosta. Esimerkiksi maalauksellisen kuvan tai vaikkapa runonpätkän tuottaminen voidaan tehdä generatiivisella tekoälyllä. Tekoälylle annetaan näissä tapauksissa opetusaineistona joukko maalauksia tai runoja ja kone omaksuu niistä relevantteja tyylejä kyeten luomaan sen pohjalta täysin uusia teoksia.
Historiallisesti ensimmäisenä generatiivisen tekoälyn sovelluksena voidaan pitää chatbotteja, joiden alkuperä juontuu 1960-luvulle. Jo silloin chatbotit tuottivat luonnollisen kielen tekstisisältöjä ja ne ovat edelleenkin laajalti käytössä.
Suureen suosioon generatiivinen tekoäly nousi kuitenkin 2014 nk. GAN-verkkojen myötä (Generative Adversarial Network), jotka kykenivät luomaan todentuntuista kuvaa, ääntä ja videota ihmisistä. Parhaita esimerkkejä tästä on tätä nykyä verkkosivu https://thispersondoesnotexist.com/ joka luo kasvokuvia ihmisistä, joita ei ole olemassa.
(Metropolia 2024).
(Kuvalähde: thispersondoesnotexist.com AI-generoitu)
Vielä vaikuttavampi saavutus generatiivisen tekoälyn saralla on nk. deep fake-videot, joissa julkisuuden henkilöt joutuvat erilaisiin keinotekoisiin tilanteisiin tai äänisyntetisaattori, jossa maailman johtajat puhuvat heidän suuhun kirjaimellisesti laitettuja sanoja. kts.
(Kuvalähde: Youtube)
https://www.youtube.com/watch?v=iyiOVUbsPcM
(Kuvalähde: Youtube)
https://www.youtube.com/watch?v=cQ54GDm1eL0
Myöhemmin tässä materiaalissa kohdattavat suuret kielimallit yhdistettynä generatiiviseen tekoälyyn ovat mahdollistaneet nykypäivän huippusovellukset kuten ChatGPT ja DALL-E.
Generatiivinen tekoäly kattaa tänä päivänä koko joukon muitakin mahdollisia sovelluksia.
- asiakaspalvelun chatbotit
- aidonnäköiset kuvat julkisuuden henkilöistä
- elokuvien jälkiäänitykset (dubbaus) näyttelijän ääntä matkimalla
- sähköpostien kirjoituttaminen tekoälyllä
- laadukkaiden digikuvien tuottaminen
- piirisuunnittelun tehostaminen jne.
Yllä olevasta listasta voidaan havaita, että generatiivista tekoälyä (kuten kaikkea teknologiaa!) voidaan käyttää sekä hyvään että pahaan. Sillä voidaan tehostaa tai jopa kokonaan automatisoida kirjoittamiseen liittyviä työvaiheita mutta sillä on myös mahdollista levittää misinformaatiota (fake news) kuulijan sitä lainkaan tietämättä.
(Metropolia 2024).
Kielimalli (language model) on koneoppimismalli, joka yksinkertaistaen ennustaa seuraavaa sanaa jonossa sanoja. Tarkastellaan esimerkiksi lauseen alkua
"The core idea in machine learning is its ability to"
Malli voisi ehdottaa seuraavaksi sanaksi joitain seuraavista vastaavine todennäköisyyksineen
detect | 2,2% |
identify | 2,5% |
find | 2,8% |
learn | 5.3% |
predict | 13,2% |
(Nämä sanat ja todennäköisyydet on saatu oikeasta toimivasta GPT2-mallista Wolfram Language -ohjelmointiympäristössä https://resources.wolframcloud.com/NeuralNetRepository/resources/GPT2-Transformer-Trained-on-WebText-Data/ )
Taulukon sanat ovat mallin mielestä järkevimmät tavat jatkaa lausetta. Malli ottaa huomioon asiayhteyden eli aiemmat sanat, niiden merkityksen ja kuinka ne liittyvät toisiinsa. Tämän ymmärryksen malli on saanut käytyään läpi opetusvaiheessa valtavan määrän (digitaalisia) tekstiaineistoja; verkkosivuja, kirjoja jne.
Kun ChatGPT kirjoittaa esimerkiksi esseetä, niin se itse asiassa jatkaa sana kerrallaan jostain (satunnaisesta) aloituskohdasta liikkeelle lähdettyään. Kuitenkaan aina ei kannata valita kaikkein todennäköisintä sanaa, koska se voisi johtaa toisteiseen tekstiin ja ei vaikuttaisi ihmisen luomukselta. Toisaalta, valitsemalla vähemmän todennäköisen sanan teksti saa omanlaistaan mielenkiintoa.
Seuraavan sanan valintaan liittyy siis aina tiettyä satunnaisuutta (epävarmuutta) ja sen vuoksi samalla lauseenaloituksella saa eri kerroilla eri jatkeen. Tämä nähdään myöhemmin konkreettisesti ChatGPT:n käytön yhteydessä.
Tämän lisäksi kielimallilla on tietoa kieliopista eli se osaa yhdistää verbejä, substantiiveja ja pronomineja luonnollisella tavalla ja se tietää mitkä sanat esiintyvät usein yhdessä.
Edellistä esimerkkiä voidaan jatkaa valitsemalla toistuvasti seuraava "sana" eli jatkamalla lausetta sana kerrallaan:
Huomaa, että tässä "sana" voi tarkoittaa myös välimerkkiä (piste, pilkku,...). Näin saadaan useista virkkeistä koostuvia kokonaisuuksia tuotettua.
(Metropolia 2024).
GPT on lyhenne sanoista Generative Pre-trained Transformers. Kyseessä on koneoppimismalli, joka perustuu takaisinkytkeytyviin neuroverkkoihin (RNN, Recurrent Neural Network).
RNN-verkossa jokaisella neuronilla on oma takaisinkytkentänsä, joka tarjoaa neuronilla sisäisen muistin. Muistin avulla neuroni voi ottaa huomioon aiemmat opit ja kykenee huomioimaan ajallisen järjestyksen. Esim. syötteen "neuroni" saadessaan RNN-verkko voi kirjainta "r" käsitellessään huomioda kirjaimet "n", "e" ja "u".
Sama perusperiaate on läsnä myös nk. Fibonaccin lukujonossa 1,2,3,5,8,13,... jossa jokainen luku on kahden edellisen luvun summa. Tällainen käsittely vaatii edellisten tietojen muistamista ja havainnoimista.
Eteenpäin syöttävä verkko unohtaa aiemmat syötteet heti ne käsiteltyään. Tämä verkkotyyppien välinen ero tekee RNN-verkoista erinomaisesti soveltuvan jonomaisen datan käsittelyyn.
Generative ("generoiva")
Syötejonon jatkamista uudella tiedolla. Esim. jatka numerosarjaa 1,3,5,7,9,...
Kielimallien yhteydessä tämä tarkoittaa sanajonon jatkamista, ja vieläpä tarkemmin, luonnollisen kielen pätkän jatkamista. (Metropolia 2024).
Pre-trained ("esiopetettu")
Esiopettaminen on kaksivaiheista. Ensin malli opetetaan valtavalla datamäärällä ja sitten se hienosäädetään tiettyyn erikoistarkoitukseen. GPT:n tapauksessa tämä tarkoittaa ensin tekstiaineistolla opettamista ja sitten räätälöimistä esim. tekstin kääntämiseen, kysymyksiin vastaamiseen tai yhteenvetojen tekemiseen. Hienosäätövaiheessa malli siis sopeutuu johonkin tiettyyn tehtävään toimiakseen siinä mahdollisimman hyvin. (Metropolia 2024).
Transformer ("muunnin")
Muunnin osaa käsitellä jonomaista dataa, esim. sanoja, kuvia tai ääntä. Neuroverkossa muunnin mahdollistaa verkon kerrosten ottamaan huomioon myös verkon muut kerrokset. Tämän myötä malli voi antaa syötejonon eri osille eri tavalla huomiota ("attention"). Esim. syötejonossa (Metropolia 2024).
"Maalari maalaa taloa"
malli voi keskittyä seuraavaa sanaa valitessaan joko sanaan "maalaa" tai "taloa" tilanteen mukaan. Tulos voisi olla joko
"Maalari maalaa taloa punaiseksi." tai
"Maalari maalaa taloa innokkaasti".
Huomaa mihin viimeinen sana on jonossa liitetty. (Metropolia 2024).
ChatGPT on OpenAI:n kehittämä tekoälyjärjestämä, joka on mittavan kehitystyön tulos. Se sai alkusysäyksensä Googlen uraauurtavasta transformer-teknologiasta vuodelta 2017.
ChatGPT:n taustalla vaikuttaa GPT-mallit, joiden edistystä on taulukoitu alla (Metropolia 2024)
versio | julkaisu | opetusdata | parametrien lkm | muuta |
GPT-1 | 06/2018 | Common Crawl https://commoncrawl.org/ (verkkosivujen keruu), BookCorpus (11000 kirjaa eri tyylisuunnista) | 117 miljoonaa | tuotti toistuvaa tekstiä, eritoten opetusdatan ulkopuolelta |
GPT-2 | 02/2019 | Common Crawl, BookCorpus, WebText | 1,5 miljardia | tuotti ihmismäistä tekstiä, sopii jo käännösten tekoon |
GPT-3 | 06/2020 | CommonCrawl, BookCorpus, Wikipedia, kirjat, artikkelit yms. | 175 miljardia | osaa tuottaa ohjelmakoodia, taidettakin, ymmärtää asiayhteyden |
GPT-4 | 2024 | ei ilmoitettu | tuhansia miljardeja? | tukee kuvasyötteitä |
Kehittynein GPT-4 malli on maksullinen tätä kirjoitettaessa.
O P A S
Aloitetaan ChatGPT:n käyttö!
Navigoi osoitteeseen www.openai.com
Aloittaaksesi ChatGPT:n käytön, navigoi osoitteeseen https://chatgpt.com/auth/login ja klikkaa Try ChatGPT (Kuva 1).
Hakukoneella: Aloita yksinkertaisesti hakemalla "ChatGPT" tai "OpenAI ChatGPT" suosikkiverkkohakukoneellasi. Hakutulokset näyttävät linkkejä OpenAI:n viralliselle verkkosivustolle ja mahdollisesti myös muihin palveluihin, jotka tarjoavat pääsyn ChatGPT:n.
Kuva 1: Kirjautuminen. Valitse Sign up. Voit käyttää mitä tahansa sähköpostiosoitetta tilisi luomiseen tai kirjautua Google tilillä, Microsoft-tilillä tai Apple-tilillä.
OpenAI:n verkkosivusto: OpenAI:n virallisella verkkosivustolla on osio ChatGPT:lle, josta löydät lisätietoa ohjelmasta, sen käyttöönottamisesta, ja linkkejä suoraan chatbotin käyttöliittymään.
Rekisteröityminen ja kirjautuminen: ChatGPT vaatii rekisteröitymistä ja sen jälkeen aina kirjautumista, jotta voit aloittaa keskustelut. Tämä prosessi on yleensä suoraviivainen.
Aloittaminen: Kun olet kirjautunut sisään, näet tekstikentän, johon voit kirjoittaa kysymyksesi tai viestisi ChatGPT:lle. Kirjoita haluamasi kysymys ja paina lähetä-nappia saadaksesi vastauksen.
Miksi Käyttää ChatGPT:tä?
ChatGPT tarjoaa monipuolisen työkalun erilaisiin tarpeisiin:
Tiedonhaku: Voit käyttää ChatGPT:tä tietolähteenä, kun etsit vastauksia kysymyksiisi.
Opiskeluapu: Se voi auttaa selittämään monimutkaisia konsepteja yksinkertaisella tavalla.
Luova Kirjoittaminen: ChatGPT voi auttaa ideoinnissa ja luovassa kirjoittamisessa, tarjoten ehdotuksia tai jatkaen tarinoita.
Ohjelmointiapu: Koodareille ChatGPT voi tarjota ohjelmointiin liittyviä neuvoja ja ratkaisuehdotuksia.
Yleinen vuorovaikutus: Jos kaipaat keskustelukumppania tai haluat vain testata, kuinka tekoäly vastaa erilaisiin kommentteihin, ChatGPT on hyvä työkalu siihen.
ChatGPT on hyödyllinen työkalu monenlaisiin käyttötarkoituksiin, esim. teknisestä avusta luovaan kirjoittamiseen.
ChatGPT:n käyttöliittymä (Kuva 2) on suunniteltu olemaan intuitiivinen ja helppokäyttöinen. Kun avaat ChatGPT:n, sinua tervehtii yksinkertainen tekstikenttä, jossa voit aloittaa keskustelun syöttämällä kysymyksen tai kommentin. Lähettämisen jälkeen tekoäly vastaa sinulle lyhyessä ajassa, jolloin keskustelu käynnistyy.
Aloitus-
Kysymysten esittäminen: Kirjoita kysymyksesi tai kommenttisi keskustelukenttään. Voit kysyä yleistietoa, pyytää apua tekstien muokkaamisessa, saada ehdotuksia tai ohjeita melkein mihin tahansa aiheeseen liittyen.
-
Vastauksen odottaminen: ChatGPT prosessoi kysymyksesi ja palauttaa vastauksen muutamassa sekunnissa. Vastaukset ovat yleensä yksityiskohtaisia ja suunniteltu vastaamaan kysymykseesi mahdollisimman hyvin.
-
Jatkokeskustelu: Voit jatkaa keskustelua esittämällä lisäkysymyksiä, tarkentamalla aiempaa kysymystäsi tai siirtymällä toiseen aiheeseen. ChatGPT pitäisi muistaa keskusteluhistorian nykyisen istunnon ajan, joten voit viitata aiempiin kysymyksiin ja vastauksiin. Joskus käy niinkin, että ChatGPT unohtaa keskustelun jolloin joudut muistuttamaan sitä.
Kuva 2: Kirjoita kysymyksesi "Message ChatGPT..." kenttään. Voit kommunikoida Suomeksi tai lähes millä tahansa kielellä!
Hyödyllisiä vinkkejä
- Tarkat kysymykset: Mitä tarkempi ja yksityiskohtaisempi kysymyksesi on, sitä relevanteimman ja hyödyllisemmän vastauksen saat.
- Keskustelun jatkaminen: Voit pyytää ChatGPT:tä jatkamaan, syventämään tai tiivistämään vastaustaan, jos ensimmäinen vastaus ei täysin tyydyttänyt tarpeitasi.
- Palautteen antaminen: Vaikka ilmaisversio ei ehkä tarjoa suoraa tapaa antaa palautetta, voit silti parantaa keskustelukokemustasi muotoilemalla kysymyksesi uudelleen, jos et ole tyytyväinen vastaukseen.
Vältä henkilökohtaisten tai arkaluontoisten tietojen syöttämistä keskusteluun.
Maksulliset versiot
Myöhemmin voit halutessasi päivittää ChatGPT:n Plus tai Team -versioon. Hinnat tarkistettu 20.2.2024 (Kuva 3).
Kuva 3. Maksulliset versiot.
ChatGPT on tekoälyteknologia, joka mahdollistaa käyttäjille monimutkaisten keskustelujen luomisen ja hallinnan. Se hyödyntää luonnollisen kielen käsittelyn (NLP) algoritmeja, jotka keskittyvät tietokoneiden kykyyn ymmärtää ja tulkita ihmiskieltä, mikä mahdollistaa tehokkaamman viestinnän ihmisten ja koneiden välillä. Se käyttää myös syväoppimisen malleja luodakseen luonnollisen kuuloisia vastauksia, jotka on räätälöity organisaation tarpeiden mukaan. ChatGPT voidaan käyttää monissa niin arjen kuin työelämänkin tilanteissa, kuten vaikkapa asiakaspalvelussa, markkinoinnissa, kääntämisessä ja suunnittelussa.
Kurssilla painopiste on erityisesti ChatGPT:n arjen peruskäytössä, mutta toki ryhmän toiveiden mukaan voidaan mennä syvemmällekin ChatGPT:n toiminnallisuuksiin. ChatGPT auttaa parantamaan asiakaspalvelua ja tehostamaan toimintaa. Sen kyky ymmärtää ja reagoida kontekstiin mahdollistaa yksilöllisemmät keskustelut käyttäjien kanssa.
Mihin ChatGPT:tä voidaan käyttää?
Käyttökohteissa vain lähes mielikuvitus on rajana! ChatGPT:n ilmaisversio ei kykene tuottamaan kuvia tai analysoimaan siihen ladattuja tiedostoja.
ChatGPT:n rajoitukset
Yksi ChatGPT:n ilmaisversion keskeisistä rajoituksista (tätä kirjoitettaessa) on sen kyvyttömyys tarjota luotettavaa tai tarkkaa tietoa tapahtumista tai tosiasioista, jotka ovat sattuneet vuoden 2023 jälkeen. Tämä johtuu siitä, että se on koulutettu käyttämään tietoja vuoden 2023 loppuun asti, eikä sillä ole pääsyä reaaliaikaiseen tai tulevaan dataan. Tämän seurauksena ChatGPT ei voi vastata suoraan kysymyksiin ajankohtaisista tapahtumista tai tarjota ajan tasalla olevia suosituksia, kuten nykyisiä sääolosuhteita tai sijoituksia osakemarkkinoilla. Maksullinen Plus-versio on ilmaisversiota kyvykkäämpi ja osaa käyttää tietoja myös vuoden 2023 jälkeen ja paljon muuta, mutta tällä kurssilla keskitymme ilmaisversion käyttöön.
Käyttäjät eivät voi kysyä ChatGPT:ltä kaikkea, koska OpenAI on asettanut "kontrollikerroksen" ChatGPT:n koulutukseen käytetyn laajan datan ja käyttäjän saaman tiedon välille. Esimerkiksi ChatGPT saattaa toki ymmärtää aiheita, kuten taloudellinen neuvonta tai ajankohtaiset sijoitusneuvot, mutta sillä ei ole valtuuksia tarjota tällaista tietoa mahdollisten vastuiden vuoksi. Lisäksi se ei voi auttaa laittomissa tai epäeettisissä toimissa, mikä havainnollistaa, kuinka kontrollikerros toimii välikätenä sen välillä, mitä ChatGPT tietää ja mitä käyttäjä näkee.
Tämän kurssin kannalta ei ole niinkään väliä, ulottuuko ChatGPT:n koulutusaineisto vuoden 2023 loppuun vai vaikkapa huhtikuuhun 2024. Yksinkertainen keino selvittää, milloin ChatGPT:si on päivitetty/tai koulutettu, on kysyä sitä siltä. (Kuva 4).
Kuva 4. Päivitys/koulutus
Kun luot kysymyksen ChatGPT:lle, kysymyksesi tulee sivun yläosaan nimellä "You".
ChatGPT:n vastaus avatarin nimellä ChatGPT.
Kehotteen jälkeen ChatGPT antaa vastauksensa tekstimuotoisena:
Tässä on huomionarvoista kuinka ChatGPT ymmärsi suomenkielisen kehotteen ja antoi myös vastineensa suomeksi. Yleensä tekoälyjärjestelmät toimivat paremmin englannin kielellä johtuen ennen kaikkea paljon suuremmasta opetusaineiston määrästä.
ChatGPT:n erityispiirre on se, että keskustelua voi jatkaa ja ChatGPT muistaa aiemmat komennot ja osaa hyödyntää niitä. Voisimme jatkaa esim. seuraavasti.
Huomaa, kuinka ChatGPT tiesti tässä, että kyse on edelleen runon tekemisestä isoäidille, vaikka uusi kehote ei sitä maininnutkaan.
Tämän ominaisuuden takia kannattaa aika ajoin aloittaa uusi keskustelu (chat), joita voi hallita palvelun sivupalkissa.
Bing-hakukone
OpenAI:n oman palvelun lisäksi GPT-kielimallia voi käyttää osana Bing-hakukonetta. Microsofin Edge-verkkoselaimessa löytyy Bing Chat, joka käyttää GPT4-mallia (maksullinen OpenAI:n kautta).
Toiminto löytyy Edgen sivupalkista painamalla ylintä sinistä painiketta.
Tässä esimerkissä huomionarvoista on se, että Bing Chatin tarjoamat linkit ovat toimivia ja relevantteja keskustelun kannalta. Tämä johtuu pohjalla toimivan GPT:n versiosta 4.
Tuntitehtävä: Yleisharjoitus Keskustele ChatGPT:n kanssa
Harjoitellaan kysymyksen esittämistä ChatGPT:lle, osa-alueeseen syventymistä ja sen jälkeen tiivistämistä. Kysy ChatGPT:ltä esimerkiksi, kuinka sähköauto toimii? Aiheen voit valita vapaasti. Sen jälkeen pyydä ChatGPT:tä syventymään johonkin tiettyyn osa-alueeseen. Lopuksi pyydä tiivistämään edellinen vastaus kolmelle ranskalaiselle viivalle.
Esimerkki:

Kuva 1. Kysymys haluamastasi aiheesta.
Asiaan syventyminen: (Kuva 2.)

Kuva 2.
Tiivistys. Kuva 3.

Kuva 3.
Siirry seuraavaksi ChatGPT:n käyttöliittymään. Kun olet tehnyt edellä mainitut kolme harjoitusta, kirjoita kunkin kohdalle (alla) "Tehty".
Sinulla ei ole tarvittavia oikeuksia tämän lomakkeen lähettämiseksi
Tehtävä: Luo suunnitelma kotisivustasi
- Miten monta sivua sivustollasi tulee olemaan vai vain etusivu?
- Sivuston arkkitehtuuri
- Sivuston graafinen ilme
Esimerkkiprompti:
Suunnittele yhdistysidea kissakahvilalle joka toimii Riihimäellä ja sivuston arkkitehtuuri. Suunnittele myös graafinen ilme. Tarvitsen myös ohjeet millaisia kuvia tullaan käyttämään ja miten monta alasivua ym.
Palautuskansio
Sinulla ei ole tarvittavia oikeuksia lähettää mitään.
Tuntitehtävä: Ajatusketjun ohjaaminen
Tutustutaan ensin teoriaan ajatusketjun ohjaamisesta:
Tällä tavalla ohjaat ajatusketjua aloittelijatasolta kohti syvempää osaamista, pitäen oppimisprosessin vaiheittaisena ja selkeänä.
Palautus
Sinulla ei ole tarvittavia oikeuksia lähettää mitään.
Palautuskansio
Sinulla ei ole tarvittavia oikeuksia lähettää mitään.
Tehtävä: Luo blogipostaus tekoälyä hyödyntämällä
Esim. Luo artikkeli aiheesta X. (Kuvaile tekoälylle mitä olet tekemässä).
Palautuskansio
Sinulla ei ole tarvittavia oikeuksia lähettää mitään.
Tehtävä: Kuvien luonti tekoälyllä
Hyödynnä kuvapankkeja, ChatGPT:tä ja Bing Image Creatoria (Linkki https://www.bing.com/images/create)
Generoi sopivia kuvia seuraaviin tarkoituksiin:
1. Vähintään 3 kuvaa etusivua varten
2. Vähintään 1 kuva Artikkelia
3. Vähintään 1 kuva Sivua varten
Palautuskansio
Sinulla ei ole tarvittavia oikeuksia lähettää mitään.
Tee tuttavuutta WordPress Teacherin kanssa
Löydät sen täältä:
https://chatgpt.com/g/g-gtodRVmEb-wp-teacher
Tutustu WordPress Teacher -työkaluun
Palautuskansio
Sinulla ei ole tarvittavia oikeuksia lähettää mitään.