Tillbaka till Statistik och datakällor

Vad är konfidens och osäkerhet i skoldata?

Skoldata kan vara mer eller mindre säker beroende på källa, gruppstorlek, svarsfrekvens, period och metod. Därför behövs osäkerhetsmarkeringar.

Det viktigaste att ta med sig

  • Konfidens handlar om hur mycket du kan lita på att underlaget bär slutsatsen.
  • Små grupper, låg svarsfrekvens och saknade indikatorer ökar osäkerheten.
  • Osäkerhet betyder inte att datan är värdelös, utan att den ska tolkas försiktigare.

Kort svar

Konfidens i skoldata handlar om hur starkt underlaget är. En siffra kan vara korrekt publicerad men ändå behöva läsas försiktigt om den bygger på få elever, få svar, gammal period eller flera saknade delar. Osäkerhet betyder inte att datan är fel. Det betyder att slutsatsen behöver vara mjukare.

Vad som ofta påverkar osäkerhet

FaktorVarför den spelar roll
Gruppstorlekfå elever gör värdet känsligare
Svarsfrekvensfå svar kan göra enkäten mindre representativ
Periodäldre data beskriver inte alltid nuläge
Saknade måtthelhetsbilden blir tunnare
Källnivåkommundata är inte samma sak som skolenhetsdata

För gymnasievalet betyder det att du inte bara ska fråga vad siffran är, utan också hur starkt underlaget bakom siffran är.

Skillnaden mellan exakt och säker

Många siffror ser exakta ut. Ett värde kan visas som 68 av 100 eller 7,4 av 10. Men antalet decimaler säger inte hur säker slutsatsen är. En exakt siffra kan bygga på tunt underlag, medan en rundad siffra kan bygga på mycket starkare data.

Det är därför skolstatistik behöver läsas med osäkerhet i åtanke. Om 20 elever har svarat på en enkät kan varje svar påverka resultatet mer än om 300 elever har svarat. Om en skola är ny kan vissa historiska mått saknas. Om ett program är litet kan ett enda år ge stora svängningar.

Läs mer om detta i små grupper statistik.

Osäkerhet i olika datatyper

Osäkerhet ser olika ut beroende på datatyp. Registerdata kan vara stark för att identifiera skolenheter, men kan ändå bli fel om en uppgift rapporterats sent. Statistik kan vara jämförbar, men ofta publicerad för en avslutad period. Enkätdata kan fånga elevupplevelse, men påverkas av svarsfrekvens och vilka som svarar.

Olika osäkerhet i olika datatyper

DatatypTypisk styrkaTypisk osäkerhet
Registerstruktur, skolenhet, huvudmanrapportering kan ändras
Statistikjämförbara mått över många skolorperiod, nivå och små grupper
Enkätelevupplevelsebortfall och svarsfrekvens
Modellvärdesammanvägd överblickmetodval och saknade delar

Det är därför skillnaden mellan registerdata, statistik och enkätdata är viktig.

Konkret gymnasieexempel

Tänk att två skolor har samma elevnöjdhet: 7,8 av 10. På den första skolan har 250 elever svarat. På den andra har 24 elever svarat. Värdet är samma, men underlaget är inte lika starkt. Den första siffran är ofta lättare att använda som stabil signal. Den andra kan fortfarande vara intressant, men du bör läsa den mer försiktigt.

Samma sak kan gälla index. Om en skola har full data för elevklimat, akademisk kontext, skolstruktur, närmiljö och områdeskontext är ett sammanvägt värde mer jämförbart. Om flera delar saknas bör modellen markera att underlaget är begränsat eller tunt.

Det betyder inte att den andra skolan är sämre. Det betyder att den är svårare att beskriva med tillgänglig data.

Hur osäkerhet bör påverka jämförelsen

Osäkerhet ska inte få dig att kasta bort data. Den ska få dig att använda data på rätt nivå.

Om underlaget är starkt kan siffran få större plats i jämförelsen. Om underlaget är begränsat bör siffran bli en fråga: varför saknas data, hur många har svarat, gäller måttet rätt nivå och finns andra mått som pekar åt samma håll?

I praktiken kan du tänka så här:

  1. starkt underlag: jämför värdet men kontrollera komponenter
  2. begränsat underlag: använd värdet som signal
  3. tunt underlag: använd värdet främst som fråga
  4. saknat underlag: dra ingen slutsats av frånvaron

Vad betyder det för gymnasievalet?

Konfidens hjälper dig avgöra hur mycket plats en siffra ska få i beslutet. Ett värde med starkt underlag kan vara en tydligare jämförelsesignal. Ett värde med tunt underlag bör snarare bli en fråga till skolan, SYV eller öppet hus.

Det betyder inte att skolor med tunnare data är dåliga. Nya, små eller smala skolor kan ha mindre publicerad statistik. Men det betyder att du behöver komplettera mer själv. Titta på programmet, prata med skolan och väg in elevberättelser och praktiska faktorer.

Vanliga missförstånd

Ett vanligt missförstånd är att osäkerhet betyder att datan är dålig. Det stämmer inte. All statistik har någon form av osäkerhet. Frågan är om osäkerheten är rimligt hanterad.

Ett annat missförstånd är att saknade värden är ett tecken på problem med skolan. Ibland saknas data för att gruppen är för liten, för att källan inte publicerar värdet eller för att skolan är ny.

Ett tredje missförstånd är att modellvärden löser osäkerhet. Modeller kan hantera osäkerhet, men de kan inte trolla fram data som inte finns.

Nästa steg

Läs vad underlaget i SCI betyder för hur osäkerhet visas i en konkret kontextmodell. Fortsätt med urval och svarsfrekvens om du vill förstå enkäter.

Källor och hämtdatum

Artikeln bygger på källorna nedan. Regler, belopp och datum kan ändras hos ansvarig myndighet eller lokal huvudman.

Artikeln använder konfidens i bred användarbetydelse: hur starkt underlaget är för tolkning, inte en specifik statistisk konfidensintervallberäkning.