Kva er statistikk?

Statistikk handlar om det å jobbe med usikkerheit knytt til korleis ting rundt oss eigentleg heng saman. Om du ikkje klarer å tolke statistikken rett, kan du bli lurt til å tru noko anna enn kva dataa faktisk viser!

Når du kastar terningar, veit du ikkje på førehand kva resultatet blir. Vi kan likevel berekne kor sannsynleg det er at du får ein gitt sum viss du kastar med to terningar.

Vi bruker statistikk for å anslå ulike ting. Frå kor mykje olje vi trur det er under havet, til kor mange som kjem til å reise på ferie til utlandet neste år.

Ein tabell, eit diagram eller ein graf er nokre måtar å presentere statistiske data på.

Forrige avsnitt

1 / 2

Neste avsnitt
Kvinne sitter foran en dataskjerm og jobber med et søylediagram.
Kvinne sitter foran en dataskjerm og jobber med et søylediagram.

Generalisering

Statistikk blir ofte brukt når det er noko vi manglar eksakt kunnskap om. Då kan vi samle inn data gjennom ulike undersøkingar.

Resultata kan bli brukte til å seie noko om kor sannsynleg det er at noko kjem til å skje.

I samband med politiske val spør ein gjerne eit utval av befolkninga om kva dei har tenkt å stemme. Svara ein får, blir brukte for å berekne kva ein trur resultatet blir viss alle i Noreg stemmer.

Å bruke svar frå ei gruppe for å kunne seie noko om kva heile befolkninga vil stemme i eit val, kallar vi for ei generalisering.

Forrige avsnitt

1 / 2

Neste avsnitt
Hendene på en mann teller stoe bunker med stemmesedler.
Hendene på en mann teller stoe bunker med stemmesedler.

Sannsyn

Sannsynsrekning og statistikk blir derfor brukt til å generalisere det eit utval har svart til å gjelde ei heil gruppe. Slik slepp vi å spørje alle.

Vi bruker derfor statistikk som grunnlag for å ta avgjerder. Under koronapandemien brukte ein statistikk for å ta avgjerder om smitteverntiltak. Då såg ein på kor mange ein trudde kom til å bli sjuke, der ein trudde smitten fann stad og liknande.

Statistikk blir brukt overalt.

I forsikring bruker ein til dømes statistikk for å anslå kor sannsynleg det er for at jordskjelv, brannar eller innbrudd vil skje. Slik kan dei fastsetje kor mykje kundane skal betale for forsikring, basert på kor sannsynleg det er at noko vil skje.

Forrige avsnitt

1 / 2

Neste avsnitt
Tre personer står i kø med en meters mellomrom.
Tre personer står i kø med en meters mellomrom.

Spørje alle i Noreg om kva dei meiner?

På nyheitene ser vi ofte resultat av spørjeundersøkingar som viser kva vi i Noreg meiner om ulike saker.

Vi kan ikkje spørje absolutt alle i Noreg om kva dei meiner kvar gong. Løysinga er at ein spør eit representativt utval. Då spør ein berre nokre i befolkninga, og så tenkjer ein at desse svara er ganske like dei ein ville fått om ein spurde alle.

I praksis betyr det at viss ein skal seie noko om kva heile Noregs befolkning meiner, så må dei ein spør vere eit gjennomsnitt av befolkninga. Då held det ikkje å berre spørje ein type menneske, til dømes dei eldre eller berre dei som elskar fotball. Då kallar vi gruppa for eit ikkje-representativt utval.

Når ein skal velje ut eit representativt utval, så skal det vere ei slags miniutgåve av den befolkninga ein gjer undersøkinga i.

Vi vel ut nokre frå den store gruppa som har nokre felles eigenskapar. Som elevane i ein bestemt klasse eller menneske som bur i eit bestemt fylke.

Kva skal vi gjere på aktivitetsdagen?

Tenk berre på din eigen klasse. Kor mange i klassen måtte de spørje for å få fram kva majoriteten (dei fleste) i klassen har lyst til å gjere på aktivitetsdagen? Held det med 2, 5, 10 elevar, eller må de spørje fleire?

Forrige avsnitt

1 / 4

Neste avsnitt
Kart over Norge der landskapet er byttet ut med ansikter.
Kart over Norge der landskapet er byttet ut med ansikter.

Sortere data

Vi sorterer data på ulike måtar. Det er avhengig av kva vi ønskjer å få vite. Skal vi sortere i stigande eller dalande rekkefølgje? Eller skal vi samle dei i ulike kategoriar ut ifrå kor mange som liker gulost eller brunost på brødskiva?

Vi kan sortere data i tabellar, grafar og diagram. Det gjer det lettare å forstå dataa.

Skjære brunost med ostehøvel.
Ruteark
Ruteark

Årsak – effekt

Mange gongar trur ein at ting heng saman utan at dei gjer det.

Tenk deg at de har to gutar i klassen som begge heiter Per. Begge gutane får veldig gode karakterar. Viss du tenkjer at årsaka til at dei får gode karakterar, er at dei heiter Per, så er du på ville vegar!

Det er ingen samanheng mellom namn og karaktar. Kanskje grunnen eigentleg er at dei to gutane gjer veldig mykje skulearbeid, og derfor får godt resultat.

To elever med beskyttelsesbriller gjør forsøk i kjemi.
To elever med beskyttelsesbriller gjør forsøk i kjemi.

Kausalitet og korrelasjon

Når vi snakkar om kausalitet, betyr det at ei årsak fører til at noko skjer. I si enklaste form kan du tenkje at når det regnar, så blir bakken våt. Då er det regnet som gjer bakken våt.

Men ofte ser vi at noko korrelerer. Det betyr at det ikkje nødvendigvis er ein samanheng mellom årsak og effekt/konsekvens. Det er ikkje sikkert bakken er våt fordi det har regna. Det kan jo tenkjast bakken er våt fordi nokon har vatna plenen.

Heimlause og kriminalitet

Eit anna døme på korrelasjon kan vere at ein i ein by har mange heimlause og mykje kriminalitet. Då kan vi lett tru at desse to tinga heng saman. Auke i talet på heimlause betyr auka kriminalitet.

Men det er farleg å slå fast at det er dei heimlause som er ansvarlege for at kriminaliteten aukar.

Det kan nemleg vere heilt andre grunnar til at ein både har mange heimlause og mykje kriminalitet.

Døme kan vere auka arbeidsløyse eller økonomisk kollaps i samfunnet.

Forrige avsnitt

1 / 4

Neste avsnitt
Grønt telt der en hjemløs bor.
Grønt telt der en hjemløs bor.

Sentralmål og spreiingstal

Vi har fleire typar sentralmål som blir brukte i statistisk arbeid. Dei mest vanlege er gjennomsnitt, median og typetal. Vi bruker desse for å kunne seie noko om dataa vi har funne.

Gjennomsnitt

Gjennomsnittet er middelverdien av alle dataa. Viss vi tenkjer oss at du samlar inn talverdiar, ville vi lagt sammen alle tala og delt på talet på verdier for å finne gjennomsnitt.

Gjennomsnittsnordmannen har 0,98 bein. Det betyr at dei fleste nordmenn ikkje er gjennomsnittlege. Talet betyr at nokre få nordmenn har mindre enn to bein fordi dei er fødde slik, eller fordi dei har fått heile eller delar av beina amputerte (opererte bort).

Median

Medianen finn vi ved først å sortere alle dataa i stigande rekkefølgje, og så finne det midtarste talet.

Lat oss tenkje oss at du spurde fem elevar i klassen om kor mange minutt dei bruker til skulen. Her er svara i stigande rekkefølgje: 3, 5, 6, 7, 10

Det midtarste talet er seks og er derfor medianen.

Median og gjennomsnitt vil ofte vere ganske nær kvarandre. I dette dømet ville gjennomsnittet ha vore 6,2 minutt. Det er ganske nær medianen.

Typetal

Typetalet er det talet som finst flest gongar i ei samling av data. Viss du set dataa dine inn i eit søylediagram, vil typetalet vere den søyla som er høgast.

Tenk deg at du spør elevane i klassen om kva slags pålegg dei liker best, og at svara er som følgjer:

  • 2 elevar seier leverpostei
  • 5 elevar seier gulost
  • 1 elev seier syltetøy

Då vil gulost vere typetalet fordi det er flest som svarer dette.

Variasjonsbreidde

Variasjonsbreidde er forskjellen mellom den største og minste verdien.

Vi kan ta eit døme som høgda til elevar i to klassar:

  • Klasse A: 152, 160, 162, 170, 171
  • Klasse B: 148, 162, 168, 170, 175

I klasse A er variasjonsbreidda 171-152 som gir 19. I klasse B er variasjonsbreidda 175-148 som gir 27. Variasjonen i høgde er mindre i klasse A enn i klasse B.

Gjennomsnittet for klasse A er 163 og for klasse B over 164. Medianen for klasse A er 162 og for klasse B er den 168. Men typetalet her er vanskelegare fordi alle elevane har ulik høgde, og derfor er det ingen tal som vi ser meir enn ein gong.

Forrige avsnitt

1 / 5

Neste avsnitt
Skoleelev måler høyden sin mot en hvit vegg der måleredskapet er tegnet inn på bildet.
Skoleelev måler høyden sin mot en hvit vegg der måleredskapet er tegnet inn på bildet.

Variablar

Variablane – dei dataa vi får inn som svar –  må kunne bli gitt verdiar som gjer at vi kan sortere dei i ulike kategoriar. Først då kan vi bruke dei. Det finst ulike typer slike data.

Diskrete variablar

Diskrete data er ei samling av enkelte tal på talinja. Vi kallar desse diskrete variablar. Eit døme på diskrete variablar kan vere talet på mål i ein fotballkamp. Mengda kan bli presentert på forma {0, 1, 2, 3 …}.

Kontinuerlege variablar

Motsetninga til diskrete variablar er kontinuerlege variablar som blir gitt som eit intervall. Eit døme kan vere høgda på juletre. Det finst uendeleg mange høgder i intervallet [1m, 3m] som 1,1m, 1,3m, 2,7m og så vidare.

Legg merke til at vi her bruker ein annan parentes enn i det førre dømet for å vise at det er eit intervall.

Nominelle data

Nokre typar data kan ikkje gjevast ein talverdi. Dette kallar vi nominelle data. Desse variablane kan bli samla i kategoriar, men ikkje bli rangerte innbyrdes ved å seie at nokre er betre eller dårlegare enn andre.

I praksis kan ein derfor finne ut kva elevane liker å ha på brødskiva i matpakka. Sjølv om mange i klassen liker gulost, så betyr ikkje det at gulost er betre enn salami eller syltetøy. Vi kan berre seie at det er fleire som har gulost på brødskiva enn andre typar pålegg.

Forrige avsnitt

1 / 4

Neste avsnitt
Grantrær i ulik høyde som ikke har blit juletrær ennå.
Grantrær i ulik høyde som ikke har blit juletrær ennå.

Kjelder:

  • Frøslie, Kathrine Frey; Bjørnstad, Jan: statistikk i Store norske leksikon på snl.no. Henta 25. november 2021 frå https://snl.no/statistikk
  • Frøslie, Kathrine Frey: korrelasjon i Store norske leksikon på snl.no.
    Henta 25. november 2021 frå https://snl.no/korrelasjon

Bilde- og videorettar:

    1. Getty Images
    2. Getty Images
    3. Getty Images
    4. Getty Images
    5. Getty Images
    6. Getty Images
    7. Getty Images
    8. Getty Images
    9. Getty Images