1.2. Tilastollisia tunnuslukuja

.


Numeroita oli annettu 31 (n=31) opiskelijalle 

keskiarvo \overline{x}=7{,}2586...\approx7{,}3
keskihajonta s=1{,}5484...\approx1{,}5

1.2. tilastollisia tunnuslukuja


Sähköisten työvälineiden käyttöohjeet löydät vasemmalta.






Luokitellun aineiston tunnusluvut GeoGebralla

Geogebran käyttö LUMA


Luokiteltu aineisto LUMA
  • jos luokiteltava aineisto on jatkuva, ota luokan todelliset ylä- ja alarajat tarkempana kuin tehtävässä annetut arvot. Esim. aika, pituus
  • jos luokiteltava aineisto on diskreetti, ota rajat kokonaislukuna.
  •  jos luokiteltavan aineiston alarajana on nolla (0) mieti voiko todellinen alaraja olla negatiivinen vai ei.



vaihteluvälin pituus
= suurin havaintoarvo – pienin havaintoarvo


keskiarvo
 \overline{x}=\frac{\Sigma x}{n}  n= esiintymiskerrat 

keskihajonta s=\sqrt{\frac{\Sigma\left(x-\overline{x}\right)^2}{n-1}}


Luokiteltu aineisto
[[$ \bar{x}=\dfrac{\sum\limits_{i=1}^{k}{{{f}_{i}}{{x}_{i}}}}{\sum\limits_{i=1}^{k}{{{f}_{i}}}} $]]

\sum_{i=1}^kf_i\ \ tarkoittaa{,}\ että\ lasketaan\ kaikki\ esiintymis\ker rat\ yhteen

keskiarvo \overline{x}=\frac{\Sigma\left(f\cdot x\right)}{n} 
x= arvo
f= esiintymiskertojen lukumäärä (=frekvenssi)

 n=esiintymiskerrat 
∑ =summan merkki


keskihajonta s=\sqrt{\frac{\Sigma f\cdot\left(x-\overline{x}\right)^2}{n-1}}


Diskreetin aineiston [[$ \color{green}{luokkien \ luokkakeskusten} $]] määrittäminen:

Esimerkki 1.

Kuusi henkilöä arvioi elokuvan asteikolla 0–5 pistettä. Arviot olivat 5, 0, 2, 5, 1 ja 5. Määritä elokuvan saamien arvioiden
a) moodi
b) keskiarvo
c) mediaani
d) keskihajonta.

Laskut tulee osata tehdä itse A-osassa!
B-osassa voit käyttää apunasi sähköisiä työvälineitä.

E1. Tilastollisia tunnuslukuja GG6:lla



Esimerkki luokitellun aineiston tutkimisesta:
Esimerkki 2

https://vimeo.com/user44764609/review/273292817/5f8bcbbe41

Keskiluvut LibreOffice Calcilla


B-osan tehtävissä voit ratkaista keskilukuja LibreOffice Calcilla seuraavien käskyjen avulla:




Kokeile laskemalla ja sähköisesti seuraavaan aineistoon:
1

3

1
8
8
7
1
8
1
1

Muista ottaa kuvakaappaus mukaan ratkaisuusi, jotta selviää miten olet saanut keskiluvut.

Ratkaisut:

Kopioi taulukko LibreOffice Calkiin

Ota seuraavat kuvakaappaukset ratkaisuusi. Ovat perustelu vastauksellesi!


tai esitä laskuna:
Muista laskujen kaavat löytyvät MAOLsta, kannattaa aina tarkistaa ne sieltä. MAOLsta löytyy myös selitykset termeille.

\frac{1+3+1+8+8+7+1+8+1+1}{10}=
\frac{5\cdot1+1\cdot3+1\cdot7+3\cdot8}{5+1+1+3}=\frac{5\cdot1+1\cdot3+1\cdot7+3\cdot8}{10}=3{,}9
\overline{x}=3{,}9


tai esitä laskuna
kirjoita arvot suuruusjärjestyksessä 1111137888 
kirjoita esiintymiskerrat taulukkoon
luku f, esiintymiskertojen lukumäärä(kpl)  
1 5 Mo=1, sillä se esiintyy useimmin, f=5 kpl
3 1  
7 1  
8 3  
yhteensä taulukossa on yhteensä 5+1+1+3= 10 lukua
 



tai esitä laskuna
Kirjoita taulukon luvut suuruusjärjestykseen, huomioi myös jokaisen luvun esiintymiskerrat:  
1111 13 7888 kahden keskimmäisen luvun 1 ja 3 keskiarvo on \frac{1+3}{2}=2 Md=2



V: \overline{x}=3{,}9
Mo=1
Md=2

Regressiosuora

Kahden muuttujan välillä on lineaarinen riippuvuus, jos niiden välinen yhteys voidaan kuvata suoralla tai sen osalla.

Lineaarisen riippuvuuden voimakkuuden tunnuslukuna käytetään korrelaatiokerrointa r, jonka arvo on välillä [-1,1]

  • Kun r\approx1 on kyseessä voimakas positiininen korrelaatio, eli pisteet menevät lähelle samaa nousevaa suoraa (kuva 1)
  • Kun r\approx-1 on kyseessä voimakas negatiivinen korrelaatio, eli pisteet menevät lähelle samaa laskevaa suoraa (kuva 2)
  • Kun r\approx0 ei korrelaatiota ole (kuva 3)


Kuva 1. Kuva 2.


Kuva 3.


r^2\ kuvaa\ selitysastetta, joka kuvaa kuinka monta prosenttia toisistaan riippuvat tilastomuuttujat selittävät toistensa vaihtelusta. (Kertaa MAB5 kurssista)

Korrelaation määrittäminen(MAB5)  r
Selitysasteen määrittäminen(MAB5)  R2


Esimerkki 3.



Ohjeet tehtävän ratkaisuun:


Siirrä aineisto GeoGebra 6:n taulukkolaskentaan.




Muodosta lineaalinen malli Asunnon koon ja hinnan välille





Vastauksena esimerkin kysymyksiin sinun tulee liittää kuvakaappaus ja kertoa sen perusteellla vastauksesi:

a)

a) Asuntojen korrelaatiokerroin on r= 0,8157 eli noi 0,82. Asunnon kokojen ja hintojen välillä on voimakas positiivinen korrelaatio.
Selitys aste r2 = 0,6654 eli noin 0,67 . Asunnon pinta-ala selittää noin 67% asunnon hinnan vaihtelusta.

b) Regressiosuoran yhtälö on y = 2153,62x + 49632,75


V: Regressiosuoran avulla, kun asunnon koko on 30 m saadaan asunnon hinnaksi noin 114 000 euroa.

c)
y=100 000
Ratkaistu CAS-lasmimella

V: Asunnon jonka koko on noin 23 m2 saa 100 000 euroa