Hva er statistikk?

Statistikk handler om det å jobbe med usikkerhet knyttet til hvordan ting rundt oss egentlig henger sammen. Om du ikke klarer å tolke statistikken riktig, kan du bli lurt til å tro noe annet enn hva dataene faktisk viser!

Når du kaster terninger, vet du ikke på forhånd hva resultatet blir. Vi kan likevel beregne hvor sannsynlig det er at du får en gitt sum hvis du kaster med to terninger.

Vi bruker statistikk for å anslå ulike ting. Fra hvor mye olje vi tror det er under havet, til hvor mange som kommer til å reise på ferie til utlandet neste år.

En tabell, diagram eller graf er noen måter å presentere statistiske data på.

Forrige avsnitt

1 / 2

Neste avsnitt
Kvinne sitter foran en dataskjerm og jobber med et søylediagram.
Kvinne sitter foran en dataskjerm og jobber med et søylediagram.

Generalisering

Statistikk brukes ofte når det er noe vi mangler eksakt kunnskap om. Da kan vi samle inn data gjennom ulike undersøkelser.

Resultatene kan brukes til å si noe om hvor sannsynlig det er at noe kommer til å skje.

I forbindelse med politiske valg, spør man gjerne et utvalg av befolkningen om hva de har tenkt til å stemme. Svarene man får, brukes for å beregne hva man tror resultatet blir hvis alle i Norge stemmer.

Å bruke svar fra en gruppe for å kunne si noe om hva hele befolkningen vil stemme i et valg, kaller vi for en generalisering.

Forrige avsnitt

1 / 2

Neste avsnitt
Hendene på en mann teller stoe bunker med stemmesedler.
Hendene på en mann teller stoe bunker med stemmesedler.

Sannsynlighet

Sannsynlighetsregning og statistikk brukes derfor til å generalisere det et utvalg har svart til å gjelde en hel gruppe. Slik slipper vi å spørre alle.

Vi bruker derfor statistikk som grunnlag for å ta beslutninger. Under koronapandemien brukte man statistikk for å ta beslutninger om smitteverntiltak. Da så man på hvor mange man trodde kom til å bli syke, hvor man trodde smitten fant sted og lignende.

Statistikk brukes overalt.

I forsikring bruker man for eksempel statistikk for å anslå hvor sannsynlig det er for at jordskjelv, branner eller innbrudd vil skje. Slik kan de fastsette hvor mye man skal betale i forsikring, basert på hvor sannsynlig det er at noe vil skje.

Forrige avsnitt

1 / 2

Neste avsnitt
Tre personer står i kø med en meters mellomrom.
Tre personer står i kø med en meters mellomrom.

Spørre alle i Norge om hva de mener?

På nyhetene ser vi ofte resultat av spørreundersøkelser som viser hva vi i Norge mener om ulike saker.

Vi kan ikke spørre absolutt alle i Norge om hva de mener hver gang. Løsningen er at man spør et representativt utvalg. Da spør man bare noen i befolkningen, og så tenker man at disse svarene er ganske like de man ville fått om man spurte alle.

I praksis betyr det at hvis man skal si noe om hva hele Norges befolkning mener, så må de man spør være et gjennomsnitt av befolkningen. Da holder det ikke å bare spørre en type mennesker, for eksempel de eldre eller bare de som elsker fotball. Da kaller vi gruppen for et ikke-representativt utvalg.

Når man skal velge ut et representativt utvalg, så skal det være en slags miniutgave av den befolkningen man gjør undersøkelsen i.

Vi velger ut noen fra den store gruppen som har noen felles egenskaper. Som elevene i en bestemt klasse eller mennesker som bor i et bestemt fylke.

Hva skal vi gjøre på aktivitetsdagen?

Tenk bare på din egen klasse. Hvor mange i klassen måtte dere spørre for å få frem hva majoriteten (de fleste) i klassen har lyst til å gjøre på aktivitetsdagen? Holder det med 2, 5, 10 elever, eller må dere spørre flere?

Forrige avsnitt

1 / 4

Neste avsnitt
Kart over Norge der landskapet er byttet ut med ansikter.
Kart over Norge der landskapet er byttet ut med ansikter.

Sortere data

Vi sorterer data på ulike måter. Det er avhengig av hva vi ønsker å vite. Skal vi sortere i stigende eller synkende rekkefølge? Eller skal vi samle dem i ulike kategorier ut ifra hvor mange som liker gulost eller brunost på brødskiva?

Vi kan sortere data i tabeller, grafer og diagrammer. Det gjør det lettere å forstå dataene.

Skjære brunost med ostehøvel.
Ruteark
Ruteark

Årsak – effekt

Mange ganger tror man at ting henger sammen uten at de gjør det.

Tenk deg at dere har to gutter i klassen som begge heter Per. Begge guttene får veldig gode karakterer. Hvis du tenker at årsaken til at de får gode karakterer, er at de heter Per, så er du på ville veier!

Det er ingen sammenheng mellom navn og karakter. Kanskje grunnen egentlig er at de to guttene arbeider veldig mye med skolearbeidet, og derfor får godt resultat.

To elever med beskyttelsesbriller gjør forsøk i kjemi.
To elever med beskyttelsesbriller gjør forsøk i kjemi.

Kausalitet og korrelasjon

Når vi snakker om kausalitet, betyr det at en årsak fører til at noe skjer. I sin enkleste form kan du tenke at når det regner, så blir bakken våt. Da er det regnet som gjør bakken våt.

Men ofte ser vi at noe korrelerer. Det betyr at det ikke nødvendigvis er en sammenheng mellom årsak og effekt/konsekvens. Det er ikke sikkert bakken er våt fordi det har regnet. Det kan jo tenkes bakken er våt fordi noen har vannet plenen.

Hjemløse og kriminalitet

Et annet eksempel på korrelasjon kan være at man i en by har mange hjemløse og mye kriminalitet. Da kan vi lett tro at disse to tingene henger sammen. Økt antall hjemløse betyr økt kriminalitet.

Men det er farlig å slå fast at det er de hjemløse som er ansvarlig for at kriminaliteten øker.

Det kan nemlig være helt andre grunner for at man både har mange hjemløse og mye kriminalitet.

Eksempler kan være økt arbeidsledighet eller økonomisk kollaps i samfunnet.

Forrige avsnitt

1 / 4

Neste avsnitt
Grønt telt der en hjemløs bor.
Grønt telt der en hjemløs bor.

Sentralmål og spredningstall

Vi har flere typer sentralmål som brukes i statistisk arbeid. De mest vanlige er gjennomsnitt, median og typetall. Vi bruker disse for å kunne si noe om dataene vi har funnet.

Gjennomsnitt

Gjennomsnittet er middelverdien av alle dataene. Hvis vi tenker oss at du samler inn tallverdier, ville vi lagt sammen alle tallene og delt på antall verdier for å finne gjennomsnitt.

Gjennomsnittsnordmannen har 0,98 bein. Det betyr at de fleste nordmenn ikke er gjennomsnittlige. Tallet betyr at noen få nordmenn har mindre enn to bein fordi de er født slik, eller fordi de har fått hele eller deler av beina amputert (operert bort).

Median

Medianen finner vi ved først å sortere alle dataene i stigende rekkefølge, og så finne det midterste tallet.

La oss tenke oss at du spurte fem elever i klassen om hvor mange minutter de bruker til skolen. Her er svarene i stigende rekkefølge: 3, 5, 6, 7, 10

Det midterste tallet er seks og er derfor medianen.

Median og gjennomsnitt vil ofte være ganske nær hverandre. I dette eksempelet ville gjennomsnittet vært 6,2 minutter. Det er ganske nærme medianen.

Typetall

Typetallet er det tallet som forekommer flest ganger i en samling av data. Hvis du setter dine data inn i et søylediagram, vil typetallet være den søylen som er høyest.

Hvis du spør elevene i klassen om hva slags pålegg de liker best, og svarene er som følger:

  • 2 elever sier leverpostei
  • 5 elever sier gulost
  • 1 elev sier syltetøy

Da vil gulost være typetallet fordi det er flest som svarer dette.

Variasjonsbredde

Variasjonsbredde er forskjellen mellom den største og minste verdien.

Vi kan ta et eksempel som høyden av elever i to klasser:

  • Klasse A: 152, 160, 162, 170, 171
  • Klasse B: 148, 162, 168, 170, 175

I klasse A er variasjonsbredden 171-152 som gir 19. I klasse B er variasjonsbredden 175-148 som gir 27. Variasjonen i høyde er mindre i klasse A enn i klasse B.

Gjennomsnittet for klasse A er 163 og for klasse B over 164. Medianen for klasse A er 162 og for klasse B er den 168. Men typetallet her er vanskeligere fordi alle elevene har ulik høyde, og derfor er det ingen tall som vi ser mer enn en gang.

Forrige avsnitt

1 / 5

Neste avsnitt
Skoleelev måler høyden sin mot en hvit vegg der måleredskapet er tegnet inn på bildet.
Skoleelev måler høyden sin mot en hvit vegg der måleredskapet er tegnet inn på bildet.

Variabler

Variablene – de dataene vi får inn som svar –  må kunne gis verdier som gjør at vi kan sortere dem i ulike kategorier. Først da kan vi bruke dem. Det finnes ulike typer slike data.

Diskrete variabler

Diskrete data er en samling av enkelte tall på tallinjen. Vi kaller disse diskrete variabler. Et eksempel på diskrete variabler kan være antall mål i en fotballkamp. Mengden kan presenteres på formen {0, 1, 2, 3 …}.

Kontinuerlige variabler

Motsetningen til diskrete variabler er kontinuerlige variabler som gis som et intervall. Et eksempel kan være høyden på juletrær. Det finnes uendelig mange høyder i intervallet [1m, 3m] som 1,1m, 1,3 m, 2,7m og så videre.

Legg merke til at vi her bruker en annen parentes enn i forrige eksempel for å vise at det er et intervall.

Nominelle data

Noen typer data kan ikke gis en tallverdi. Dette kaller vi nominelle data. Disse variablene kan samles i kategorier, men ikke rangeres innbyrdes ved å si at noen er bedre eller dårligere enn andre.

I praksis kan man derfor finne ut hva elevene liker å ha på brødskiva i matpakka. Selv om mange i klassen liker gulost, så betyr ikke det at gulost er bedre enn salami eller syltetøy. Vi kan bare si at det er flere som har gulost på brødskiva enn andre typer pålegg.

Forrige avsnitt

1 / 4

Neste avsnitt
Grantrær i ulik høyde som ikke har blit juletrær ennå.
Grantrær i ulik høyde som ikke har blit juletrær ennå.

Kilder:

  • Frøslie, Kathrine Frey; Bjørnstad, Jan: statistikk i Store norske leksikon på snl.no. Hentet 25. november 2021 fra https://snl.no/statistikk
  • Frøslie, Kathrine Frey: korrelasjon i Store norske leksikon på snl.no.
    Hentet 25. november 2021 fra https://snl.no/korrelasjon

Bilde- og videorettigheter:

    1. Getty Images
    2. Getty Images
    3. Getty Images
    4. Getty Images
    5. Getty Images
    6. Getty Images
    7. Getty Images
    8. Getty Images
    9. Getty Images