#Beslutsstöd

Känn ditt data

Jag jobbar ideellt med drunkningsprevention, främst issäkerhet. Normalt sker de flesta drunkningar på sommaren, då många badar eller är ute på sjön i båt. Tittar man på månadsstatistik för drunkningar bland svenskar över de senaste 30 åren sticker dock två andra månader ut: september och december. Den 28 september 1994 sjönk Estonia och den 26 december 2004 inträffade tsunamin i Indiska oceanen. Känner man inte till dessa exceptionella händelser kan man lätt dra felaktiga slutsatser, som att båtolyckor främst sker i september.

Skridskoakare

Ett annat exempel är en studie av skador i olika sporter. Enligt undersökningen var huvudskador på grund av kollision med broar vanligt bland skridskoåkare. Underlaget var 16 000 åkare, vilket ingav förtroende. Jag som är en flitig skridskoåkare, fattade dock en misstanke att studien var gjord från det Nederländska Elvastadsloppet, som senast hade cirka 16 000 deltagare. I Nederländerna är kollision med låga broar inte ovanligt vid skridskolopp på kanalerna. Däremot är den skaderisken knappast representativ för skridskoåkning i sin helhet. Här hade man missat att underlaget var skevt.

Stora och små fel

Studerar man stora datamängder, brukar små fel inte spela stor roll om man nöjer sig med en ungefärlig siffra. Men bryter man ned informationen på detaljnivå, kan mindre fel eller oväntade händelser ge stora avvikelser i vissa fall.

Ön Sottunga är Finlands minsta kommun med cirka hundra invånare, de flesta äldre. De hade väldigt mycket fylleri och våldsbrott. De berodde på att Finlandsfärjorna passerade ön mitt i natten. Besättningen rapporterar då in stök på båten till polisen, vilket bokfördes i kommunen. Rutinerna ska nu ha ändrats.

Så det är viktigt att ha kunskap om sitt data för att förstå om det kan finnas fel i insamlingen. Hittar man konstiga avvikelser kan det vara värt att ta reda på vad det kan bero på och inte ta det förgivet som en sanning. Är något fel, eller finns en naturlig förklaring? Ibland kan man enkelt se varför det avviker. Andra gånger kan det vara mycket svårt. Sedan får man fundera på om de avvikande uppgifterna ska vara med i statistiken eller inte. Det kan dock vara lämpligt att ge en kommentar till avvikelsen.

En annan luring är att det man mäter inte är riktigt samma sak som det man vill påvisa. Om antalet dömda för brott av en viss typ minskar, kan det betyda att rättsväsendet blivit mindre effektivt att döma gjorda brott, men det kan också vara så att färre brott begås.

En tidningsartikel skrev om varifrån Sverige importerar kläder. De två största länderna var Kina och Indien, vilket verkade rimligt. Det tredje var Danmark! Siffran beskrev troligen inte kläder gjorda i Danmark, utan kläder importerade via Danmark på tåg och lastbil.

Statistik är väldigt användbart och ett fundament för många av de framsteg mänskligheten gjort. Men citatet "lögn, förbannad lögn och statistik" som ofta tillskrivs författaren Mark Twain, är värt att ha i åtanke. Fel använd, kan statistik ge en väldigt skev bild av verkligheten.

 

Publicerad: 2021-11-30