Välkommen till sidan om hypotesprövning
Avsnittet om hypotesprövning beskriver de centrala delarna i statistisk hypotesprövning. Nollhypotesen (H₀) anger att ingen effekt eller skillnad finns, medan alternativhypotesen (H₁) anger att en effekt finns. Teststatistiken mäter hur mycket data avviker från H₀ och används för att beräkna p‑värdet, som visar sannolikheten att få ett lika extremt resultat om H₀ är sann. Signifikansnivån (α) avgör när resultatet anses statistiskt signifikant, och valet mellan ensidigt och tvåsidigt testpåverkar hur p‑värdet tolkas beroende på testets riktning, och slutligen typ I och typ II-fel.
Nollhypotesen
Nollhypotesen (H₀) är det grundläggande antagandet i ett test och uttrycker ofta att det inte finns någon effekt, skillnad eller samband. Till exempel, om man undersöker om sömn påverkar koncentration, kan H₀ vara att antal timmar sömn inte påverkar koncentrationsnivå.
Alternativhypotesen
Alternativhypotesen (H₁ eller Ha) är motsatsen till nollhypotesen och anger att det faktiskt finns en effekt eller skillnad. I samma exempel kan H₁ vara att mer sömn leder till högre koncentration.
Teststatistik
Teststatistiken är ett numeriskt värde som beräknas från datan och används för att jämföra med vad som förväntas under nollhypotesen. Den anger hur mycket data avviker från förväntningarna under H₀. Ju större avvikelse, desto mindre blir p‑värdet.
Vanliga teststatistiktyper:
- r (korrelation)
- t‑värde (t-test)
- F‑värde (ANOVA)
- χ² (chi-två-test)
P-värden
P‑värdet är sannolikheten att få ett testresultat lika extremt eller mer extremt än det observerade, givet att nollhypotesen är sann.
Ett högt p‑värde (t.ex. p = 0,15) tyder på att resultatet inte avviker tillräckligt från förväntningarna under H₀, och H₀ behålls.
Ett lågt p‑värde (t.ex. p = 0,03) indikerar att resultatet är osannolikt under H₀ och ger anledning att överväga att förkasta nollhypotesen.
Signifikansnivå
Signifikansnivån är en förutbestämd tröskel som avgör när ett resultat anses statistiskt signifikant, ofta satt till α = 0,05 (5 %).
Om p ≥ α → H₀ behålls och resultatet anses inte signifikant.
Om p < α → H₀ förkastas och resultatet anses signifikant.
Ensidigt vs tvåsidigt test
Valet mellan ensidigt och tvåsidigt test påverkar hur p‑värdet beräknas:
Ensidigt test: Kontrollerar extremvärden i en specifik riktning.
Exempel: Testa om mer sömn ökar koncentration.
Tvåsidigt test: Kontrollerar extremvärden i båda riktningarna.
Exempel: Testa om sömn påverkar koncentration utan att anta riktning.
Typ I-fel
Ett typ I-fel uppstår när man förkastar nollhypotesen trots att den egentligen är sann. Det innebär att man påstår att det finns en effekt eller skillnad fast det i själva verket inte gör det. Sannolikheten för typ I-fel styrs av signifikansnivån (α), som oftast sätts till 0,05, vilket betyder att man accepterar en 5 % risk att begå felet. Den vanligaste orsaken till typ I-fel är att man använder en alltför låg signifikansnivå eller genomför många tester utan att korrigera för detta (så kallad multipel testproblematik).
Typ II-fel
Ett typ II-fel inträffar istället när man behåller nollhypotesen trots att den är falsk. Det innebär att man missar att upptäcka en verklig effekt eller skillnad. Sannolikheten för typ II-fel betecknas med β, och hänger ihop med testets styrka (power = 1 − β). Ju lägre power, desto större risk för typ II-fel. Den vanligaste orsaken till typ II-fel är istället för små stickprov, vilket leder till låg statistisk styrka och därmed en ökad risk att missa verkliga effekter.