GOFAI till deep learning
Under vårkonferensen förra fredagen hade vi ett seminarium om Artificiell Intelligens (AI) som inleddes med att Hedvig Kjellström, professor på avdelningen för robotik, perception och lärande på KTH samt huvudforskare hos Silo AI, höll en föreläsning för oss.
Hon gick igenom hur tanken om AI utvecklats från Good Old Fasioned Artificial Intelligence (GOFAI) som på 80-talet baserades på olika tillståndsrum har utvecklats till nutidens artificiella neurala nätverk och deep learning. GOFAI-systemen visades ha väldigt begränsad nytta vilket ledde att kommersiell AI lades på is i många år men idag har detta begrepp fått ett massivt uppsving igen. Denna transformation har gjorts möjlig tack vare ökad tillgång på data, förbättrad beräkningskapacitet och nya smarta metoder. Idag kan man dela upp AI lösningarna lite grovt i två typer av system, autonoma och intelligensförstärkande (Intelligence Augumentation eller IA). Två välkända exempel på autonoma system är självkörande bilar och riktad marknadsföring. Hedvig ville dock hellre prata mer om de intelligensförstärkande systemen. Där gavs röstassistenter, medicinsk bildanalys och exoskelett som några exempel på hur människor och AI kan arbeta tillsammans.
Efter föreläsningen hade vi diskussioner i mindre grupper där vi försökte kombinera det vi fått lära oss med tidigare kunskaper för att föreslå tillämpningar av AI för våra kunder. Det vi snabbt insåg var att de exempel som tagits upp var intressanta men ganska svåra att applicera på utveckling av IT-tjänster eller att implementera i konventionellt beslutsstöd. Det vi är intresserade av är ju hur man kan använda dessa metoder för att skapa värde åt våra kunder. Av den anledningen har jag tagit en lite annan vinkel i detta blogginlägg och beskrivit grunderna i kommersiell AI och hur man kan komma igång med att använda AI-modeller i sin organisation.
Vad innebär AI idag?
De typer av AI-lösningar som idag har bredast spridning och dessutom gör stor bevisad nytta handlar ofta om maskininlärning eller prediktiv analys. Dessa lösningar kan användas i första hand för att lösa problem som har med regression, klassificering, klusteranalys eller avvikelsedetektering att göra. I grunden handlar allt om avancerad statistik där modellen kan förbättra sig själv ju mer data som finns tillgänglig. Maskininlärning delas vanligen in i väglett och icke-väglett lärande, här tillsammans med några exempel som används av organisationer runt om i världen idag:
Icke-väglett lärande (unsupervised learning)- Klusteranalys
-
- För att hitta nya förbättrade kundsegment
- Gruppering av websidor för mer relevanta sökresultat
- Inom naturlig språkbehandling (NLP) för att precisare tolkningar
- Avvikelsedetektering
- Identifiering av bedrägliga transaktioner inom finans
- Detektera misstänkt fusk vid tester och prov
- Avancerad spårning av avvikande information inom datarengöring
- Regression
- Förväntade försäljningspriser på bostäder
- Energieffektivisering av fastigheter
- Klassificering
- Segmentering av potentiella kunder för riktad marknadsföring
- Riskgruppssegmentering för precisare försäkringspremier
- Automatiserad analys av kundrecensioner i forum eller sociala medier
Det viktigaste som krävs för att implementera maskininlärning är stora mängder data – och inte vilken data som helst – tvättad data som är behandlad och rätt formaterad. Det är i detta steg som det mesta av arbetsbördan ofta ligger. Vid icke-väglett lärande låter man algoritmen själv hitta olika mönster i datamängden. Dessa tidigare okända mönster kan vara början på en helt ny affärsmöjlighet eller ett sätt för modellen att sortera ut avvikande information eller beteenden. De kan också ligga till grund för nya modeller av väglett lärande. För att kunna använda modeller av väglett lärande krävs dessutom att olika set och kombinationer av data värderas på något sätt. Det kan vara i form av rätt eller fel, en kategori så som en ko eller katt, eller slutpriset på en lägenhetsförsäljning. Dessa kombinationer av variabler och deras värde används sedan för att träna upp modellen. Eftersom resultaten är helt beroende av träningsdatan måste man vara väldigt medveten om risken med inbyggda men oavsiktliga snedvridningar (så kallade biases). Här har vi 5 kända exempel på AI system där olika typer av biases i träningsdatan resulterade i oförutsedda problem.
För att använda en algoritm för maskininlärning på en uppsättning data behöver man idag ingen djupare förståelse för hur de olika algoritmerna fungerar. Det finns flera onlineplattformar så som Azure Machine Learning, TensorFlow och Amazon SageMaker med enkla verktyg för att bygga avancerade arbetsflöden. Olika färdiga algoritmer kan sedan väljas ur en lista, beroende på vad man vill åstadkomma. Man ska dock vara medveten om att det man får ut av maskininlärning är svar men sällan en utförlig förklaring till hur algoritmen fick fram just de svaren.
Att strukturera sin data
Om man som företag idag har ett modernt datalager finns det en stor chans att man redan har många av de bitar som krävs för att implementera värdeskapande AI i sin verksamhet. Om man i dagsläget inte har ett datalager och är lite fler än några få anställda kan det vara hög tid att börja fundera på om man ska samla den data som organisationen genererar på ett mer strukturerat sätt. Därifrån är steget mot en lösning för Business Intelligence (BI) och sedan även AI-modeller inte särskilt stort. Oftast känns det dock tryggare att börja med att få en tydlig bild av organisationens nuvarande data med hjälp av ett BI-system innan man tar nästa steg mot lösningar baserade på AI.