Hva er statistikk?

Statistikk handler om det å jobbe med usikkerhet knyttet til hvordan ting rundt oss egentlig henger sammen. Det er viktig å tolke statistikken riktig. Ellers kan du bli lurt til å tro noe annet enn hva dataene faktisk viser!

Når du kaster terninger, vet du ikke på forhånd hva resultatet blir. Vi kan likevel beregne hvor sannsynlig det er at du får en gitt sum hvis du kaster med to terninger.

Vi bruker statistikk for å anslå ulike ting. Fra hvor mye olje vi tror det er under havet, til hvor mange som kommer til å reise på ferie til utlandet neste år. En tabell, diagram eller graf er noen måter å presentere statistiske data på.

Forrige avsnitt

1 / 2

Neste avsnitt
Kvinne sitter foran en dataskjerm og jobber med et søylediagram.
Kvinne sitter foran en dataskjerm og jobber med et søylediagram.

Generalisering

Statistikk brukes ofte når det er noe vi mangler eksakt kunnskap om. Da kan vi samle inn data gjennom observasjon og ulike undersøkelser. Resultatene kan brukes til å si noe om hvor sannsynlig det er at noe kommer til å skje, eller til å vurdere omfanget av noe.

I forbindelse med politiske valg, spør man gjerne et utvalg av befolkningen om hva de har tenkt til å stemme. Basert på disse svarene, gjør man et anslag av hva hele befolkningen i Norge vil stemme på. Dette kaller vi for en generalisering.

Forrige avsnitt

1 / 2

Neste avsnitt
Hendene på en mann teller stoe bunker med stemmesedler.
Hendene på en mann teller stoe bunker med stemmesedler.

Sannsynlighet

Sannsynlighetsregning og statistikk brukes derfor til å generalisere det et utvalg har svart til å gjelde en hel gruppe. Slik slipper vi å spørre alle.

Statistikk brukes som grunnlag for å ta beslutninger. Under koronapandemien brukte man statistikk for å ta beslutninger om smitteverntiltak. Da så man på hvor mange man trodde kom til å bli syke, hvor man trodde smitten fant sted og lignende.

I finans bruker man statistikk til å se trender i handelslivet. I forsikring for å anslå hvor sannsynlig det er at for eksempel jordskjelv, branner eller innbrudd vil skje. Slik kan de fastsette hvor mye man skal betale i forsikring basert på hvor sannsynlig det er at noe vil skje.

Forrige avsnitt

1 / 2

Neste avsnitt
Tre personer står i kø med en meters mellomrom.
Tre personer står i kø med en meters mellomrom.

Spørre alle i Norge om hva de mener?

På nyhetene ser vi ofte resultat av spørreundersøkelser som viser hva vi i Norge mener om ulike saker.

Vi kan ikke spørre absolutt alle i Norge om hva de mener hver gang. Løsningen er at man spør et representativt utvalg. Da spør man bare noen i befolkningen, og så tenker man at disse svarene er ganske like de man ville fått om man spurte alle.

I praksis betyr det at hvis man skal si noe om hva hele Norges befolkning mener, så må de man spør være et gjennomsnitt av befolkningen.

Da holder det ikke å bare spørre de eldre eller bare de som elsker fotball. Da får vi det vi kaller et ikke-representativt utvalg.

Når man skal velge ut et representativt utvalg, så skal det være en slags miniutgave av den befolkningen man gjør undersøkelsen i.

Vi velger ut noen fra den store gruppen som har noen felles egenskaper. Som elevene i en bestemt klasse eller mennesker som bor i et bestemt fylke.

Hva skal vi gjøre på aktivitetsdagen?

Tenk bare på din egen klasse. Hvor mange i klassen måtte dere spørre for å få frem hva majoriteten (de fleste) i klassen har lyst til å gjøre på aktivitetsdagen?

Holder det med 2, 5, 10 elever, eller må dere spørre flere?

Forrige avsnitt

1 / 4

Neste avsnitt
Kart over Norge der landskapet er byttet ut med ansikter.
Kart over Norge der landskapet er byttet ut med ansikter.

Sortere data

Vi sorterer data på ulike måter. Det er avhengig av hva vi ønsker å vite.

Vi kan sortere i rekkefølge:

  • Stigende rekkefølge – fra minst til størst
  • Synkende rekkefølge – fra størst til minst

Vi kan sortere i kategorier:

  • De som liker brunost på brødskiva
  • De som liker gulost på brødskiva
  • De som ikke liker ost på brødskiva

Vi kan sortere data i tabeller, grafer og diagrammer. Det gjør det lettere å forstå dataene når vi for eksempel lett kan se om det er stor forskjell på hvor mange som liker brunost sammenlignet med hvor mange som liker gulost på brødskiva.

Skjære brunost med ostehøvel.
Ruteark
Ruteark

Årsak – effekt

Mange ganger tror man at ting henger sammen uten at de gjør det.

Tenk deg at dere har to gutter i klassen som begge heter Per. Begge guttene får veldig gode karakterer. Hvis du tenker at årsaken til at de får gode karakterer, er at de heter Per, så er du på ville veier!

Det er ingen sammenheng mellom navn og karakteren de får på skolearbeidet. Kanskje grunnen egentlig er at de to guttene arbeider veldig mye med skolearbeidet, og derfor får godt resultat.

To elever med beskyttelsesbriller gjør forsøk i kjemi.
To elever med beskyttelsesbriller gjør forsøk i kjemi.

Kausalitet og korrelasjon

Når vi snakker om kausalitet, betyr det at en årsak fører til at noe skjer (konsekvens).

I sin enkleste form kan du tenke at når det regner, så blir bakken våt. Da er det regnet som gjør bakken våt. Regnet er årsaken; at bakken er våt, er konsekvensen.

Men ofte ser vi at noe korrelerer. Det betyr at det ikke nødvendigvis er en sammenheng mellom årsak og effekt/konsekvens.

Det er ikke sikkert bakken er våt fordi det har regnet. Det kan jo tenkes bakken er våt fordi noen har vannet plenen. Da kan vi ikke si at konsekvensen (bakken er våt) skyldes årsak (at det regner). Her er det en annen årsak (at noen har vannet plenen).

Hjemløse og kriminalitet

Et annet eksempel på korrelasjon kan være at man i en by har mange hjemløse og mye kriminalitet. Da kan vi lett tro at disse to tingene henger sammen ved å tro at flere hjemløse betyr at det blir mer kriminalitet.

Men vi kan ikke uten videre si at det er de hjemløse som er ansvarlig for at kriminaliteten øker.

Derimot kan det være andre ting som forklarer både at det blir flere hjemløse, og at det blir mer kriminalitet.

Økt arbeidsledighet kan være årsak til at flere blir hjemløse. Uten jobb klarer de kanskje ikke å betale husleie eller huslån. Økt arbeidsledighet kan også føre til økt kriminalitet. Uten jobb kan det være at flere stjeler for å få mat fordi de ikke har inntekt.

Forrige avsnitt

1 / 4

Neste avsnitt
Grønt telt der en hjemløs bor.
Grønt telt der en hjemløs bor.

Sentralmål og spredningstall

Vi har flere typer sentralmål som brukes i statistisk arbeid. De mest vanlige er gjennomsnitt, median og typetall.

Vi bruker disse for å kunne si noe om dataene vi har funnet.

Gjennomsnitt

Gjennomsnittet er middelverdien av alle dataene. Hvis vi tenker oss at du samler inn tallverdier, ville vi lagt sammen alle tallene og delt på antall verdier for å finne gjennomsnitt.

 

Hvis vi tenker oss alle nordmenn, så vil de aller fleste ha to bein. Noen få vil ha ett bein eller kanskje de har amputert et halvt bein. Gjennomsnittet av antall bein ville kanskje derfor vært 0,98 bein. Det betyr at de fleste nordmenn ikke er gjennomsnittlige, men sier det veldig mye om hvordan de fleste nordmenn ser ut?

Median

Medianen finner vi ved først å sortere alle dataene i stigende rekkefølge, og så finne det midterste tallet.

La oss tenke oss at du spurte fem elever i klassen om hvor mange minutter de bruker til skolen. Her er svarene i stigende rekkefølge: 3, 5, 6, 7, 10

Det midterste tallet er seks og er derfor medianen.

Median og gjennomsnitt vil ofte være ganske nær hverandre.  Som du har lest tidligere, så vil vi finne gjennomsnittet ved å legge sammen alle de fem tallene og så dele på 5. I dette eksempelet ville gjennomsnittet vært 6,2 minutter. Det er ganske nærme medianen.

Typetall

Typetallet er den verdien som forekommer flest ganger i en samling av data. Hvis du setter dine data inn i et søylediagram, vil typetallet være den søylen som er høyest.

Hvis du spør elevene i klassen om hva slags pålegg de liker best, og svarene er som følger:

  • 2 elever sier leverpostei
  • 5 elever sier gulost
  • 1 elev sier syltetøy

Da vil gulost være typetallet fordi det er flest som svarer dette.

Variasjonsbredde

Variasjonsbredde er forskjellen mellom den største og minste verdien.

Vi kan ta et eksempel som høyden av elever i to klasser:

  • Klasse A: 152, 160, 162, 170, 171
  • Klasse B: 148, 162, 168, 170, 175

I klasse A er den høyeste eleven 171 cm. Den laveste eleven er 152 cm. Vi regner derfor ut 171-152 som gir 19. Variasjonsbredden er derfor 19 i klasse A.

I klasse B er variasjonsbredden 175-148 som gir 27. Variasjonen i høyde er derfor mindre i klasse A enn i klasse B.

Forrige avsnitt

1 / 5

Neste avsnitt
Skoleelev måler høyden sin mot en hvit vegg der måleredskapet er tegnet inn på bildet.
Skoleelev måler høyden sin mot en hvit vegg der måleredskapet er tegnet inn på bildet.

Variabler

Variablene – de dataene vi får inn som svar –  må kunne gis verdier som gjør at vi kan plassere dem i ulike kategorier. Først da kan vi bruke dem. Det finnes ulike typer slike data.

Diskrete variabler

Diskrete data er en samling av enkelte tall på tallinjen. Vi kaller disse diskrete variabler.

Et eksempel på diskrete variabler kan være antall mål i en fotballkamp. Mengden kan presenteres på formen {0, 1, 2, 3 …}.

Kontinuerlige variabler

Motsetningen til diskrete variabler er kontinuerlige variabler som gis som et intervall. Et eksempel kan være høyden på juletrær. Det finnes uendelig mange høyder i intervallet [1m, 3m].

Legg merke til at vi bruker en annen type parentes her enn i det forrige eksempelet. Det er for å vise at det er et intervall. Vi bruker disse parentesene for å vise at det er mange verdier mellom 1 m og 3 m – som som 1,1m, 1,3 m, 2,7m og så videre.

Nominelle data

Noen typer data kan ikke gis en tallverdi. Dette kaller vi nominelle data. Disse variablene kan samles i kategorier, men vi kan ikke si at den ene typen er bedre enn en annen.

I praksis kan man derfor finne ut hva elevene liker å ha på brødskiva i matpakka. Selv om mange i klassen liker gulost, så betyr ikke det at gulost er bedre enn salami eller syltetøy. Vi kan bare si at det er flere som har gulost på brødskiva enn andre typer pålegg.

Forrige avsnitt

1 / 4

Neste avsnitt
Grantrær i ulik høyde som ikke har blit juletrær ennå.
Grantrær i ulik høyde som ikke har blit juletrær ennå.

Kilder:

  • Frøslie, Kathrine Frey; Bjørnstad, Jan: statistikk i Store norske leksikon på snl.no. Hentet 25. november 2021 fra https://snl.no/statistikk
  • Frøslie, Kathrine Frey: korrelasjon i Store norske leksikon på snl.no.
    Hentet 25. november 2021 fra https://snl.no/korrelasjon

Bilde- og videorettigheter:

    1. Getty Images
    2. Getty Images
    3. Getty Images
    4. Getty Images
    5. Getty Images
    6. Getty Images
    7. Getty Images
    8. Getty Images
    9. Getty Images