Vad är en variabel?

Välkommen till sidan om vad en variabel är.

Variabler är centrala inom statistik och forskning, och de kan anta olika former beroende på vilken typ av information de representerar. På denna sida går vi igenom de vanligaste typerna av variabler och hur de används i analys, för att ge en tydlig grund inför vidare arbete i statistikprogram som SPSS och Jamovi.

Nominalskala

Nominala variabler används när vi vill dela in information i olika kategorier, men där det inte finns någon inbördes ordning mellan grupperna. Kategorierna är bara namn eller etiketter.

När används det? När vi vill beskriva eller jämföra grupper. Vi kan räkna hur många som tillhör varje kategori och undersöka skillnader i fördelning, men vi kan inte säga att en kategori är ”mer” eller ”mindre” än en annan.

Exempel: kön (man/kvinna/annat), ögonfärg (blå, brun, grön), civilstånd (gift, ogift, skild).

Ordinalskala

Ordinala variabler har också kategorier, men här går det dessutom att rangordna dem. Vi kan säga att en nivå är högre eller lägre än en annan, men vi vet inte hur stora skillnaderna är mellan nivåerna.

När används det? När vi vill jämföra rangordning, till exempel vem som har högst eller lägst nivå. Vi kan ta reda på medianvärde eller se vilken kategori som är vanligast. Däremot kan vi inte säga att skillnaden mellan två steg alltid är lika stor.

Exempel: skolbetyg (A–F), utbildningsnivå (grundskola, gymnasium, högskola), enkätsvar på en skala 1–5 (”instämmer inte alls” → ”instämmer helt”).

Intervallskala

En intervallvariabel är en numerisk variabel där skillnaderna mellan värden är lika stora, men variabeln saknar en sann nollpunkt. Det innebär att man kan räkna skillnader, men inte meningsfulla kvoter.

Exempel:

  • Temperatur i Celsius eller Fahrenheit
  • Kalenderår (t.ex. 1990, 2000, 2010)

Egenskaper och användning:

Vanliga statistiska analyser inkluderar medelvärde, standardavvikelse, korrelation och regression.

Skillnaden mellan två värden är meningsfull (t.ex. skillnaden mellan 10°C och 20°C är samma som mellan 20°C och 30°C).

Saknar sann nollpunkt (0 betyder inte “inget”).

Kvotskala

En kvotvariabel är en numerisk variabel som har lika stora skillnader mellan värden och dessutom en sann nollpunkt, vilket gör att både skillnader och kvoter är meningsfulla.

Exempel:

  • Vikt (kg)
  • Längd (cm)
  • Ålder (år)
  • Tid (sekunder)

Egenskaper och användning:

Kvotvariabler kan användas i samma statistiska analyser som intervallvariabler, men dessutom kan man räkna kvoter (t.ex. dubbelt så mycket, hälften så mycket).

Skillnader mellan värden är meningsfulla.

Nollvärde betyder verkligen “ingen mängd” av det som mäts.

Dikotom variabel

En dikotom variabel är en speciell typ av nominalvariabel som endast kan anta två möjliga värden.

Exempel:

  • Kön: man / kvinna
  • Rökare: ja / nej
  • Klarat prov: pass / fail

Egenskaper och användning:

I regressionssammanhang kan 1 ibland tolkas som “mer” och 0 som “mindre”.

Dikotoma variabler kodas ofta med 0 och 1, vilket underlättar statistiska analyser.

Vanliga statistiska metoder för dikotoma variabler är: t-test (vid jämförelse mellan två grupper), chi-två-test (vid frekvensjämförelser), logistisk regression (vid prediktion av binära utfall)

Eftersom variabeln endast har två kategorier finns ingen naturlig rangordning.

Diskret variabel

En diskret variabel är en numerisk variabel som endast kan anta separata, åtskilda värden, ofta heltal. Den är räknbar, vilket innebär att det finns ett tydligt “antal” för varje observation, och det går inte att ha värden mellan de definierade nivåerna.

Exempel:

  • Antal barn i en familj (0, 1, 2…)
  • Antal rätt på ett prov (0–20)
  • Antal bilar i en familj

Egenskaper:

Kan analyseras med frekvenstabeller, chi-två-test eller Poisson-regression.

Värden är separata och inte kontinuerliga.

Går att räkna och summera, men mellanvärden existerar inte.

Kontinuerlig variabel

En kontinuerlig variabel kan anta vilket värde som helst inom ett intervall, inklusive decimaler. Den är mätbar med hög precision och kan beskriva gradvisa skillnader mellan observationer.

Exempel:

  • Vikt i kilogram (45,2 kg, 45,25 kg)
  • Längd i centimeter (170,3 cm)
  • Tid i sekunder (12,45 s)

Egenskaper:

Ger möjlighet till många statistiska analyser: medelvärde, standardavvikelse, korrelation, regression, t-test och ANOVA.

Oändligt antal möjliga värden inom ett intervall.

Kan mätas på intervall- eller kvotnivå.

Beroende variabel

Beroende variabel (DV / utfallsvariabel / y)

Den beroende variabeln är det utfall eller resultat som forskaren vill mäta eller förklara. Den påverkas av den oberoende variabeln. Ibland kallas den även för utfallsvariabel.

Exempel:

  • Påverkas prestation på ett test av sömn? → Testresultat = y
  • Påverkar träning blodtrycket? → Blodtryck = y

Egenskaper:

Statistiska analyser fokuserar ofta på hur y förändras i relation till olika faktorer (x).

Kan vara kontinuerlig, diskret, dikotom, ordinal eller kvot/intervall, beroende på hur utfallet mäts.

Oberoende variabel

Oberoende variabel (IV / faktor / prediktor / x)

Den oberoende variabeln är den som man tror påverkar den beroende variabeln. Den kallas ibland för prediktor, faktor eller förklarande variabel.

Exempel:

  • Sömn (antal timmar) → x
  • Träningsprogram (ja/nej) → x
  • Ålder, kön eller utbildningsnivå → x

Egenskaper:

  • Kan vara kontinuerlig, diskret, dikotom eller kategorisk.
  • I experiment kontrollerar forskaren x för att se dess effekt på y.
  • I observationsstudier används x som prediktor i regressionsanalyser.

Faktor

I statistiska analyser, särskilt ANOVA, används termen faktor för att beskriva en oberoende variabel (x) som har flera nivåer eller grupper.

Exempel:

  • Träningsprogram med tre olika intensitetsnivåer → träningsprogram är en faktor (x) med tre nivåer.
  • Kön som faktor → två nivåer (x: man/kvinna).

Prediktor

I regressionssammanhang används termen prediktor för en oberoende variabel (x) som används för att förutsäga eller förklara variation i den beroende variabeln (y).

Exempel:

Prediktion av blodtryck (y) utifrån ålder, vikt och fysisk aktivitet (x) → alla dessa är prediktorer.

Sammanställning

Typ / nivåVariabelexempelSymbolStatistiska analyser
Beroende / utfallTestresultat, blodtryckyt-test, ANOVA, regression, korrelation
Oberoende / prediktor / faktorSömn, träningsprogram, ålderxRegression, ANOVA, chi-två-test
DikotomKön, rökare, pass/failx eller yt-test, chi-två, logistisk regression
NominalFärg på bil, nationalitetx eller yChi-två, frekvens
OrdinalSmärtskala, betygx eller yMann-Whitney, Kruskal-Wallis, Spearman
DiskretAntal barn, antal rättx eller yFrekvens, Poisson-regression, t-test/ANOVA
KontinuerligVikt, längd, tidx eller yMedelvärde, SD, t-test, ANOVA, regression
IntervallTemperatur, årtalx eller yMedelvärde, SD, regression
KvotVikt, längd, ålder, tidx eller yMedelvärde, SD, regression, kvoter