#Beslutsstöd

Vad är den viktigaste tillgången på IT avdelningen?

Vad är den viktigaste tillgången på IT avdelningen? Kanske är det personalen. Men efter det? Och vad lär vara det mest bestående? Jag vill påstå att det är det data som ligger djupt ner i systemen.

Krav på din data

I detta digitaliseringens tidevarv kommer det bli allt mer påtagligt hur viktigt data är och hur viktigt det är att kunna komma åt, förädla och bygga vidare på data som går att sammanföra från verksamhetens olika system. Detta ställer dock krav på ditt data och så klart på de system som används för att skapa, lagra och tillgängliggöra data. Allra störst är kraven på masterdata, dvs data som beskriver viktiga begrepp, som används av hela organisationen, t.ex. kund, produkt och anställd.

Händer som skriver data


Ofta har det varit i analys och uppföljning som datakvalitetbrister har uppdagats, detta för att det centrala datalagret läser in och sammanför data från flera viktiga verksamhetssystem, som ofta inte delar definition av de centrala begreppen. Det är lätt att svänga sig med begrepp som kund och tro att det är självklart vad en kund är, men om man tittar närmare på det visar det sig ofta att olika delar av organisationen har olika bilder av begreppet.

Automatiserade processer synliggör databrister och skillnader

Idag, när allt fler processer automatiseras, kommer databrister och skillnader i definitioner att bli uppenbara och få automatiseringen att halta eller fallera. En mänsklig mellanhand har många gånger kunnat justera och kompensera för skillnader och brister, men de automatiseringsverktyg vi använder idag har bara förmågan att utföra exakt definierade uppgifter, som inte kräver intelligens eller fantasi.

Datakvalitet har flera dimensioner

Det sammanhållande för att få full utdelning på datakapitalet är att data behöver ha en hög kvalitet. Datakvalitet har flera dimensioner, som alla behöver följas upp. Det går att göra andra indelningar. Det går att dela upp dem mer, men jag väljer följande:

  • Först och främst ska data vara korrekt. Det betyder att värdena på attributen ska vara rätt, men även att attributen ska vara begripliga för dem som använder data. För att säkra detta är det viktigt att vara överens om den datamodell som används i och mellan systemen.

    Det är även viktigt att kunna följa upp data för att säkra att innehållet i systemen är riktigt. Det är dock en svår dimension att följa upp, då det kan vara svårt att hitta en säker korrekt källa att jämföra med. Inom denna dimension kan man även ta med datas härkomst och efterföljare, det vill säga hur data rör sig i organisationen och hur det påverkar trovärdigheten.

  • Data behöver även vara fullständigt, det vill säga att de alla de begrepp och attribut som verksamheten behöver ska finnas och ha värden. Här kan verksamheten ha olika uppfattning om vilka attribut som behövs. Om t.ex. HR-avdelningen har ansvaret för personalrelaterad data, så kanske de inte tycker att anställdas certifieringar hör dit.

    En annan del av organisationen kan anse att den informationen om respektive individ är absolut nödvändig då den exempelvis avgör vilka roller den anställda får inneha. Det finns inte bara en lösning på hur data ska lagras, men den sammantagna modellen behöver man vara överens om och lösningen bör säkra att det finns en master och en sanning.

  • Data ska ha rätt noggranhet. Det gäller granularitet (hur aggregerat eller detaljerat eller inte data är) och även precisionen på värden t.ex. hur många decimaler ett värde sparas med. Olika avdelningar kan exempelvis ha olika detaljerad syn på de produkter eller tjänster som bolaget säljer, inte minst beroende av hur detaljerat man vill följa upp.

    Bygger man en hierarkisk modell, så kan flera nivåer av detaljrikedom tillgodoses. Det är viktigt att vara överens om vad de olika nivåerna ska innehålla och vem som ansvarar för de olika delarna av hierarkin.

  • Data ska även vara konsistent. Reglerna för data och hur det hänger ihop ska vara tydligt och enhetligt genomfört inom system och mellan dem. Det betyder t. ex. att referentiell integritet ska vidmakthållas, även mellan system. I detta ingår även att entiteter ska ha en unik och identifierbar representation. Dubbletter leder till att konsistensen havererar.

    Det går att ta upp både strukturell och semantisk konsistens. Den strukturella rör datamodeller, format och referenser medan den semantiska är att alla som hanterar begreppen har samma syn på vad de betyder och på namnsättning.

    I konsistent dimensionen ingår även presentationen av värdena, t.ex. format och hur NULL (d.v.s. tomma värden) ska presenteras.

  • Slutligen ska data vara tillgängligt. Rätt data ska vara tillgängligt tillräckligt snabbt, både att finnas där i tid och att svarstiden vid frågor är låg. Det betyder också att data finns på rätt sätt och till rätt mottagare. Vad som är tillräckligt snabbt, rätt sätt och rätt mottagare är givetvis något som varierar från fall till fall.

Samarbete är nyckeln för bra datakvalitet

För alla punkter gäller att IT avdelningen eller verksamhetens avdelningar inte ensamma eller var och en för sig kan lösa detta och upprätthålla en hög kvalitet på data. Nyckeln till framgång heter samarbete. Verksamheten behöver ta fram definitioner och inte sällan testa dem i samarbete med IT. Vana datamodellerare eller t. ex. en erfaren datalagerutvecklare kan ofta snabbt identifiera brister i definitionerna och de gränsfall som sätter verksamhetens bilder av verkligheten på prov.

Det är också IT som många gånger vet vilka tekniker som kan erbjudas och utgående från verksamhetens behov kan de välja rätt teknik. I den processen är det viktigt att tänka på att tekniken inte har något egenvärde, utan bara är en möjlighet att hantera verksamhetens behov. De problem tekniken kan lösa är i första hand tillgängligheten, men utan att data först uppfyller de föregående punkterna, så spelar tillgängligheten ingen roll. När det gäller verksamhetens data, så är modellen det mest centrala och därefter ansvaret för att underhålla det.

Allt detta kan tyckas självklart, men att tillämpa det sätter ofta en organisation på prov. Oenigheter kommer upp till ytan och behöver lösas, så att en gemensam kanonisk modell kan tas fram för systemen att använda mellan sig, även när de internt skiljer sig från den. Vägen från en samling system, med var sin egen definition, till en systempark, som kan kommunicera med varandra via den kanoniska datamodellen är en investering. Men att inte göra den investeringen betyder att skatten i form av data som systemen gömmer fortsätter att ligga inlåst och förblir dåligt utnyttjad.

Vill du veta mer om hur du kommer igång med detta arbete - eller är nyfiken på hur det är att jobba på Agero? Kom och ta en kaffe med oss!

Publicerad: 2020-02-04