Kva er statistikk?

Statistikk handlar om det å jobbe med usikkerheit knytt til korleis ting rundt oss eigentleg heng saman. Det er viktig å tolke statistikken rett. Elles kan du bli lurt til å tru noko anna enn det dataa faktisk viser!

Når du kastar terningar, veit du ikkje på førehand kva resultatet blir. Vi kan likevel berekne kor sannsynleg det er at du får ein gitt sum viss du kastar med to terningar.

Vi bruker statistikk for å anslå ulike ting. Frå kor mykje olje vi trur det er under havet, til kor mange som kjem til å reise på ferie til utlandet neste år. Ein tabell, eit diagram eller ein graf er nokre måtar å presentere statistiske data på.

Forrige avsnitt

1 / 2

Neste avsnitt
Kvinne sitter foran en dataskjerm og jobber med et søylediagram.
Kvinne sitter foran en dataskjerm og jobber med et søylediagram.

Generalisering

Statistikk blir ofte brukt når det er noko vi manglar eksakt kunnskap om. Då kan vi samle inn data gjennom observasjon og ulike undersøkingar. Resultata kan bli brukte til å seie noko om kor sannsynleg det er at noko kjem til å skje, eller til å vurdere omfanget av noko.

I samband med politiske val spør ein gjerne eit utval av befolkninga om kva dei har tenkt å stemme. Basert på desse svara, gjer ein eit anslag av kva heile befolkninga i Noreg vil stemme på. Dette kallar vi for ei generalisering.

Forrige avsnitt

1 / 2

Neste avsnitt
Hendene på en mann teller stoe bunker med stemmesedler.
Hendene på en mann teller stoe bunker med stemmesedler.

Sannsyn

Sannsynsrekning og statistikk blir derfor brukt til å generalisere det eit utval har svart til å gjelde ei heil gruppe. Slik slepp vi å spørje alle.

Statistikk blir brukt som grunnlag for å ta beslutningar. Under koronapandemien brukte ein statistikk for å ta beslutningar om smitteverntiltak. Då såg ein på kor mange ein trudde kom til å bli sjuke, kvar ein trudde smitten fann stad og liknande.

I finans bruker ein statistikk til å sjå trendar i handelslivet. I forsikring for å anslå kor sannsynleg det er at til dømes jordskjelv, brannar eller innbrot vil skje. Slik kan dei fastsetje kor mykje kundane skal betale for forsikringar basert på kor sannsynleg det er at noko vil skje.

Forrige avsnitt

1 / 2

Neste avsnitt
Tre personer står i kø med en meters mellomrom.
Tre personer står i kø med en meters mellomrom.

Spørje alle i Noreg om kva dei meiner?

På nyheitene ser vi ofte resultat av spørjeundersøkingar som viser kva vi i Noreg meiner om ulike saker.

Vi kan ikkje spørje absolutt alle i Noreg om kva dei meiner kvar gong. Løysinga er at ein spør eit representativt utval. Då spør ein berre nokre i befolkninga, og så tenkjer ein at desse svara er ganske like dei ein ville fått om ein spurde alle.

I praksis betyr det at viss ein skal seie noko om kva heile den norske befolkninga meiner, så må dei ein spør, vere eit gjennomsnitt av befolkninga.

Då held det ikkje å berre spørje dei eldre eller berre dei som elskar fotball. Då får vi det vi kallar eit ikkje-representativt utval.

Når ein skal velje ut eit representativt utval, så skal det vere ein slags miniutgåve av den befolkninga ein gjer undersøkinga i.

Vi vel ut nokon frå den store gruppa som har nokre felles eigenskapar. Som elevane i ein bestemt klasse eller menneske som bur i eit bestemt fylke.

Kva skal vi gjere på aktivitetsdagen?

Tenk berre på din eigen klasse. Kor mange i klassen måtte de spørje for å få fram kva majoriteten (dei fleste) i klassen har lyst til å gjere på aktivitetsdagen?

Held det med 2, 5, 10 elevar, eller må de spørje fleire?

Forrige avsnitt

1 / 4

Neste avsnitt
Kart over Norge der landskapet er byttet ut med ansikter.
Kart over Norge der landskapet er byttet ut med ansikter.

Sortere data

Vi sorterer data på ulike måtar. Det er avhengig av kva vi ønskjer å vite.

Vi kan sortere i rekkefølgje:

  • Stigande rekkefølgje – frå minst til størst
  • Dalande rekkefølgje – frå størst til minst

Vi kan sortere i kategoriar:

  • Dei som liker brunost på brødskiva
  • Dei som liker gulost på brødskiva
  • Dei som ikkje liker ost på brødskiva

Vi kan sortere data i tabellar, grafar og diagram. Det gjer det lettare å forstå dataa når vi til dømes lett kan sjå om det er stor forskjell på kor mange som liker brunost samanlikna med kor mange som liker gulost på brødskiva.

Skjære brunost med ostehøvel.
Ruteark
Ruteark

Årsak – effekt

Mange gongar trur ein at ting heng saman utan at dei gjer det.

Tenk deg at de har to gutar i klassen som begge heiter Per. Begge gutane får veldig gode karakterar. Viss du tenkjer at årsaka til at dei får gode karakterar, er at dei heiter Per, så er du på ville vegar!

Det er ingen samanheng mellom namnet og karakteren dei får på skulearbeidet. Kanskje grunnen eigentleg er at dei to gutane gjer veldig mykje skulearbeid, og derfor får godt resultat?

To elever med beskyttelsesbriller gjør forsøk i kjemi.
To elever med beskyttelsesbriller gjør forsøk i kjemi.

Kausalitet og korrelasjon

Når vi snakkar om kausalitet, betyr det at ei årsak fører til at noko skjer (konsekvens).

I si enklaste form kan du tenkje at når det regnar,  så blir bakken våt. Då er det regnet som gjer bakken våt. Regnet er årsaka; at bakken er våt, er konsekvensen.

Men ofte ser vi at noko korrelerer. Det betyr at det ikkje nødvendigvis er ein samanheng mellom årsak og effekt/konsekvens.

Det er ikkje sikkert bakken er våt fordi det har regna. Det kan jo tenkjast bakken er våt fordi nokon har vatna plenen. Då kan vi ikkje seie at konsekvensen (bakken er våt) kjem av årsaka (at det regnar). Her er det ei anna årsak (at nokon har vatna plenen).

Heimlause og kriminalitet

Eit anna døme på korrelasjon kan vere at ein i ein by har mange heimlause og mykje kriminalitet. Då kan vi lett tru at desse to tinga heng saman ved å tru at fleire heimlause betyr at det blir meir kriminalitet.

Men vi kan ikkje utan vidare seie at det er dei heimlause som er ansvarlege for at kriminaliteten aukar.

Derimot kan det vere andre ting som forklarer både at det blir fleire heimlause, og at det blir meir kriminalitet. Auka arbeidsløyse kan vere årsak til at fleire blir heimlause. Utan jobb greier dei kanskje ikkje å betale husleige eller huslån. Auka arbeidsløyse kan òg føre til auka kriminalitet. Utan jobb kan det vere at fleire stel for å få mat fordi dei ikkje har inntekt.

Forrige avsnitt

1 / 4

Neste avsnitt
Grønt telt der en hjemløs bor.
Grønt telt der en hjemløs bor.

Sentralmål og spreiingstal

Vi har fleire typar sentralmål som blir brukte i statistisk arbeid. Dei mest vanlege er gjennomsnitt, median og typetal.

Vi bruker desse for å kunne seie noko om dataa vi har funne.

Gjennomsnitt

Gjennomsnittet er middelverdien av alle dataa. Viss vi tenkjer oss at du samlar inn talverdiar, ville vi lagt saman alle tala og delt på talet på verdiar for å finne gjennomsnittet.

 

Viss vi tenkjer oss alle nordmenn, så vil dei aller fleste ha to bein. Nokre få vil ha eitt bein, eller kanskje dei har amputert eit halvt bein. Gjennomsnittet av talet på bein ville kanskje derfor ha vore 0,98 bein. Det betyr at dei fleste nordmenn ikkje er gjennomsnittlege, men seier det veldig mykje om korleis dei fleste nordmenn ser ut?

Median

Medianen finn vi ved først å sortere alle dataa i stigande rekkefølgje, og så finne det midtarste tallet.

La oss tenkje oss at du spurde fem elevar i klassen om kor mange minutt dei bruker til skulen. Her er svara i stigande rekkefølgje: 3, 5, 6, 7, 10

Det midtarste talet er seks og er derfor medianen.

Median og gjennomsnitt vil ofte vere ganske nær kvarandre.  Som du har lese tidligare, så vil vi finne gjennomsnittet ved å leggje saman alle dei fem tala og så dele på 5. I dette dømet ville gjennomsnittet ha vore 6,2 minutt. Det er ganske nær medianen.

Typetal

Typetalet er den verdien som finst flest gongar i ei samling av data. Viss du set dataa dine inn i eit søylediagram, vil typetalet vere den søyla som er høgast.

Tenk deg at du spør elevane i klassen om kva slags pålegg dei liker best, og at svara er som følgjer:

  • 2 elevar seier leverpostei
  • 5 elevar seier gulost
  • 1 elev seier syltetøy

Då vil gulost vere typetalet fordi det er flest som svarer dette.

Variasjonsbreidde

Variasjonsbreidde er forskjellen mellom den største og minste verdien.

Vi kan ta eit døme som høgda til elevane  i to klasser:

  • Klasse A: 152, 160, 162, 170, 171
  • Klasse B: 148, 162, 168, 170, 175

I klasse A er den høgaste eleven 171 cm. Den lågaste eleven er 152 cm. Vi reknar derfor ut 171-152 som gir 19. Variasjonsbreidda er derfor 19 i klasse A.

I klasse B er variasjonsbreidda 175-148 som gir 27. Variasjonen i høgde er derfor mindre i klasse A enn i klasse B.

Forrige avsnitt

1 / 5

Neste avsnitt
Skoleelev måler høyden sin mot en hvit vegg der måleredskapet er tegnet inn på bildet.
Skoleelev måler høyden sin mot en hvit vegg der måleredskapet er tegnet inn på bildet.

Variablar

Variablane – dei dataa vi får inn som svar –  må kunne bli gitt verdiar som gjer at vi kan plassere dei i ulike kategoriar. Først då kan vi bruke dei. Det finst ulike typar slike data.

Diskrete variablar

Diskrete data er ei samling av enkelte tal på talinja. Vi kallar desse diskrete variablar.

Eit døme på diskrete variablar kan vere talet på mål i ein fotballkamp. Mengda kan bli presentert på forma {0, 1, 2, 3 …}.

Kontinuerlege variablar

Motsetninga til diskrete variablar er kontinuerlege variablar som blir gitt som eit intervall. Eit døme kan vere høgda på juletre. Det finst uendeleg mange høgder i intervallet [1m, 3m].

Legg merke til at vi bruker ein annan type parentes her enn i det førre dømet. Det er for å vise at det er eit intervall. Vi bruker desse parentesane for å vise at det er mange verdiar mellom 1m og 3m – som 1,1m, 1,3m, 2,7m og så vidare.

Nominelle data

Nokre typar data kan ikkje bli gitt ein talverdi. Dette kallar vi nominelle data. Desse variablane kan bli samla i kategoriar, men vi kan ikkje seie at den eine typen er betre enn den andre.

I praksis kan ein derfor finne ut kva elevane liker å ha på brødskiva i matpakka. Sjølv om mange i klassen liker gulost, så betyr ikkje det at gulost er betre enn salami eller syltetøy. Vi kan berre seie at det er fleire som har gulost på brødskiva enn andre typar pålegg.

Forrige avsnitt

1 / 4

Neste avsnitt
Grantrær i ulik høyde som ikke har blit juletrær ennå.
Grantrær i ulik høyde som ikke har blit juletrær ennå.

Kjelder:

  • Frøslie, Kathrine Frey; Bjørnstad, Jan: statistikk i Store norske leksikon på snl.no. Henta 25. november 2021 frå https://snl.no/statistikk
  • Frøslie, Kathrine Frey: korrelasjon i Store norske leksikon på snl.no.
    Henta 25. november 2021 frå https://snl.no/korrelasjon

Bilde- og videorettar:

    1. Getty Images
    2. Getty Images
    3. Getty Images
    4. Getty Images
    5. Getty Images
    6. Getty Images
    7. Getty Images
    8. Getty Images
    9. Getty Images