Kort svar
Regression är en statistisk metod som används för att analysera hur flera faktorer hänger ihop med ett utfall. I skolanalys kan utfallet vara examensgrad, betyg, behörighet eller progression. Faktorerna kan vara tidigare betyg, program, elevsammansättning, skolstorlek eller andra kontextvariabler.
Regression i enkel form
| Del | Exempel i skolanalys |
|---|---|
| Utfall | examensgrad eller betyg |
| Förklarande faktorer | tidigare betyg, program, bakgrund, skolstruktur |
| Modell | uppskattar samband mellan faktorer och utfall |
| Rest/avvikelse | skillnad mellan faktiskt och förväntat utfall |
Regression kan vara kraftfullt, men den visar inte automatiskt orsak.
Varför regression används i skolfrågor
Skolresultat påverkas av många faktorer samtidigt. Om du bara jämför råa resultat kan du missa att skolor har olika startläge. Regression används för att hålla flera faktorer i huvudet samtidigt.
Till exempel kan en modell fråga: hur mycket hänger gymnasieexamen ihop med tidigare meritvärde, programtyp och andra faktorer? När modellen har uppskattat sambanden kan den jämföra faktiska resultat med förväntade resultat.
Det är en av idéerna bakom riskjustering och vissa value added-modeller. Men metoden kräver bra data och tydliga antaganden.
Regression är inte orsak i sig
Ett viktigt metodord här är samband. Regression visar hur variabler samvarierar i modellen. Den bevisar inte automatiskt att en faktor orsakar en annan.
Om högre tidigare betyg hänger ihop med högre examensgrad betyder det inte att modellen ensam förklarar allt. Det kan finnas andra faktorer som inte ingår, till exempel motivation, stöd hemma, lärarkvalitet, skolmiljö eller programval.
Regression kräver försiktig tolkning
| Risk | Vad du ska fråga |
|---|---|
| Saknade variabler | finns viktiga faktorer som modellen inte ser? |
| Fel nivå | gäller modellen elev, program, skola eller kommun? |
| Övertolkning | läses samband som orsak? |
| Rankingeffekt | används avvikelse som enkel topplista? |
Konkret gymnasieexempel
Tänk att forskare vill förstå vad som påverkar examen inom tre år. De kan bygga en regressionsmodell där utfallet är om elever tar examen, och där tidigare meritvärde, programtyp och andra faktorer ingår.
Om modellen visar att tidigare betyg har starkt samband med examen är det inte förvånande. Det hjälper oss förstå varför skolors råa resultat kan skilja sig. En skola som tar emot elever med höga tidigare betyg har ett annat startläge än en skola med fler elever som haft det svårt tidigare.
Men regressionen säger inte ensam hur bra varje skola arbetar. Den kan ge mer rättvis kontext, men den kan också missa sådant som inte finns i datan.
Regression och value added
I value added-modeller används regression ofta för att uppskatta förväntat resultat utifrån startläge. Skillnaden mellan faktisk utveckling och förväntad utveckling kan tolkas som ett slags mervärde.
Det låter attraktivt, men är svårt på gymnasienivå. Elever väljer program, skolor har olika profiler, antagningen sorterar elever och många utfall påverkas av tidigare kunskaper. Därför behöver value added i skolan förklaras försiktigt.
När du ser en regressionsbaserad analys, fråga:
- vilket utfall modellen försöker förklara
- vilka faktorer som ingår
- vilka viktiga faktorer som saknas
- om resultatet läses som samband eller orsak
Vad betyder det för gymnasievalet?
Regression är mer relevant för analys än för vardagligt skolval, men begreppet hjälper dig förstå varför forskare är försiktiga med enkla slutsatser. Om en modell visar att tidigare betyg hänger ihop med gymnasieresultat betyder det att startläget spelar roll. Det betyder inte att skolan saknar betydelse.
För dig som jämför skolor är lärdomen att resultat behöver sammanhang. En skola kan ha höga resultat av flera skäl. En annan kan ha lägre resultat men starkt stödarbete. Regression hjälper forskare att undersöka sådana samband, men ditt val behöver också väga in vardag, program och trivsel.
Se därför regressionsbaserade resultat som forskningsspråk för komplexa samband. De kan förklara varför enkla jämförelser blir för grova, men de ska inte ersätta din läsning av skolsidan.
Vanliga missförstånd
Ett vanligt missförstånd är att regression automatiskt är mer sann än enklare statistik. Den kan vara mer informativ, men bara om modellen är rimligt byggd.
Ett annat missförstånd är att en modell som kontrollerar för flera faktorer kontrollerar för allt. Det gör den aldrig.
Ett tredje missförstånd är att regression kan göra skolranking rättvis. Den kan förbättra vissa jämförelser, men den löser inte hela frågan om kvalitet, programprofil och elevens personliga val.
Nästa steg
Läs korrelation i skolstatistik för skillnaden mellan samband och orsak. Fortsätt med riskjustering om du vill förstå varför regression används i justerade jämförelser.