Uudisvoog:

Tagasi

Miks kaaluda igas ettevõttes masinõppemudeli kasutamist

Allikas: Äri-IT Sügis 2023

Autor: Mihkel Solvak, TÜ tehnoloogiauuringute kaasprofessor

Masinõppe ja lihtsama tehisintellekti (AI – Artificial Intelligence) toel toimivaid tooteid kasutame digikanalites juba iga päev ja enamasti on seal tegemist standardlahendustega.

 

Miks kaaluda igas ettevõttes masinõppemudeli kasutamist

Samas on ettevõtete äriprotsessides veel palju kohti, kus standardiseeritud lahendust riiulist võtta ei ole.

Eesti ettevõtted on masinõppeprojektide käivitamisel veel üsna ettevaatlikud. Põhjusi on laias laastus kaks. Esiteks on igasugune masinõppe rakenduse loomine kõrge riskiga projekt. Võib ilmneda, et andmeid ei ole mudelite treenimiseks piisavalt ja nad ei ole nii kvaliteetsed. Samas ei pruugi ka siis mudel täpseks osutuda. Ja kõike seda saame teada alles siis, kui ligi 70% sammudest on juba tehtud (andmeaudit, modelleerimise katsetused, valitud mudeli(te) treenimine ja kontrolliminekinnitamine…). Teiseks ei muuda ükski masinõppemudel iseenesest midagi – ka selle mudeliga seotud konkreetne äriprotsess tuleb ümber disainida.

Risk, et midagi välja ei tule, on seega päris suur. Aga kui need riskid maandada, võib kasu osutuda ka suureks. Eesti riik on masinõppe ja AI toe avalikesse teenustesse lõimimise fookusesse võtnud. Oleme ülikoolis ehitanud riigiasutustele mitmeid masinõppe rakendusi. Näiteks Töötukassale tehtud OTT ehk otsustustugi on saanud ka parima andmeid kasutava teenuse auhinna. Probleemid, mida nende rakendustega lahendatakse, on väga sarnased ja seetõttu on ka riskide maandamise ning kasu maksimeerimise viisid üsna ülekantavad.

 

Riskide maandamine

Esiteks on mõistlik jagada masinõppemudeli tellimine etappideks ja teha iga etapi järel otsus, kas minna sellega edasi või mitte. Kui andmed ei ole kvaliteetsed, siis seal tegevused lõpevadki. Kui testmudelid pole täpsed, siis pole mõtet edasi minna. Kui mudeli tootestamine ja live’i viimine tähendab ebamõistlikku kulu, et reaalajas andmed liikuma saada, siis on ka testandmestiku põhjal loodud hea täpsusega mudel ikkagi arukas riiulile jätta. Kui masinõppemudeli ümber olevat tööprotsessi uueks disainida ei suudeta, siis pole mõtet ka mudeli integratsiooni tellida jne.

 

Kasutamine

Milliste probleemide puhul tasuks eeskätt kaaluda masinõppe-/AI-mudelite rakendamist? Reeglina on need meetodid tugevad väljundite prognoosimisel ja nõrgemad selle selgitamisel. Näiteks suudetakse üsnagi täpselt prognoosida klientide lahkumise tõenäosust või uue toote edukuse tõenäosust, kuid mitte selgitada seda, miks klient nii käitub. Selliseid olukordi nimetatakse klassifitseerimisülesanneteks, eesmärgiks leida võimalikult täpselt,millise tõenäosusega klient kuulub lojaalsesse (0) või lahkuvasse (1) klassi. Kui mudel on riskid välja arvutanud, saab selle alusel kliendibaasi ära segmenteerida ning riskisegmendis vajalikud sammud teha. Kui ei ole selge, miks kliendid lahkuvad, siis on võimalik segmentides lihtsalt kliendikontakte värskendada, arvestades, et tihtilugu piisab lahkumistõenäosuse vähendamiseks juba mõne meene saatmisest või enese meeldetuletamisest.

Lisanduvate uute toodete ehk upselling’u probleemi puhul polegi reeglina vaja teada, miks keegi seda toodet on valmis tarbima. Võtame näiteks olukorra, kus 3000 kliendile saadetakse pakkumine, eesmärgiks saada 150 konversiooni (150 pakkumise avamist ja ostu sooritamist).

Sama eesmärgi – 150 konversiooni – saaks märksa nutikamalt täita ka siis, kui teha ainult 300 pakkumist segmendile, kus reageerimise tõenäosus on näiteks 70%. Ehk sama palju konversioone saavutatakse kümme korda väiksema tööga ning suurt osa kliendibaasist ei tülitata pakkumisega, millest nad pole ilmselgelt huvitatud.

Masinõppe hea kasutuskoht on seega olukord, kus midagi võib, kuid ei pruugi juhtuda ja kus on vaja langetada otsus selle tulemuse esilekutsumiseks (nt toote müük) või ärahoidmiseks (kliendi lahkumine). Neid olukordi nimetatakse mittedeterministlikeks ja neid iseloomustab reeglina suurem infopuudus, nii et siin on tulemuse riskiprognoos eriti kõrge väärtusega, vähendades ebakindlust otsustamisel.

Mittedeterministlikke sündmusi esineb ka tehnilistes süsteemides. Me soovime prognoosida elektrivõrgurikkeid, võttes arvesse võrku iseloomustavaid parameetreid, või tuleõnnetuste puhkemise riski vastavalt ilmale ja ehitise tehnilistele oludele, kui meil on need andmed. Me soovime prognoosida liiklusõnnetuse riske mingites punktides, kui meil on olemas liiklusvoo ja teeolude andmed jne.

Mainitud Töötukassa OTT-mudel arvutab näiteks, millise tõenäosusega saab töötu 180 päeva jooksul uuesti tööle või kas ta tuleb uuesti arvele võtta. Vastavalt sellele optimeeritakse temaga seotud tegevused ja talle pakutavad teenused. See mudel kasutab nii juhumetsa kui nn boostingalgoritme, mille eelis on suutlikkus kinni püüda andmetes esinevaid mittelineaarseid ja mittepidevaid seoseid. Arvutatavad riskid on seega hästi spetsiifilised ja nii pole vaja opereerida väga üldiste seostega stiilis, et tööta jäämise tõenäosus suureneb vanusega. Tegelikult võib see suureneda ja väheneda sõltuvalt eri vanusevahemikest ja see keeruline seos võib omakorda ajas kasvõi aastaaegadest tulenevalt dünaamiliselt muutuda. Masinõppemudel suudab alusandmete muutumisele kiire ümbertreenimisega kohanduda.

Samas on nende näidete puhul oluline meeles pidada, et selliseid asju saab prognoosida vaid siis, kui meil on andmed nii nende esinemise kui mitteesinemise kohta. Oleks vaja näha kogu seltskonda, kes mingite sündmuste riske tekitavad. Kui teil on näiteks head andmed vaid nende klientide kohta, kes mingi toote tarbimisse võtsid, siis ei saa upsellingu’t toetavat masinõppemudelit tegelikult ehitada. Nimelt puudub teil samasugune andmestik klientide kohta, kes seda toodet ei tarbi, nii et te näete klassifitseerimisülesande juures hästi vaid nn ühtesid (tarbijaid), aga mitte nulle (mittetarbijaid). Ühest silmast pimedana klassifitseerimisülesannet teadagi lahendada ei saa.

 

Ettevõtte kasu maksimeerimine

Masinõppemudel prognoosib reeglina üht kitsast sündmust, aga kasu maksimeerimiseks tasuks mõelda, kuidas ehitada selle ümber vertikaalne kasutuslugu ettevõttes. Näiteks kliendi lahkumise riski mudel töötab kitsalt lõppkliendi tasemel ehk arvutab riske iga indiviidi puhul, kes on hetkel klient. Aga sedasama numbrit saab kasutada kõikidel organisatsiooni tasanditel.

Kliendihaldur näeb oma portfelli klientide riskijaotust ja keskendub vaid suurima riskiga klientidele. Kliendihaldurite või büroo juht näeb omakorda haldurite portfellide pilte ja saab juhtida nende tööd, suunates parimad haldurid kõige raskemate klientidega tegelema või planeerides mehitatust selle järgi, kuidas jaotuvad lõppklientide riskid. Teenuse või toote omanik näeb aga, millise riskitasemega kliendid tema teenust tarbivad ja kui head tulemust masinõpe riskide maandamisel annab. Regiooni või osakonna juht saab võtta üldise klientide riskide maandamise osakonna võtmenäidikuks ehk KPIks, et hinnata, kuivõrd edukalt lõppkliendi probleeme lahendatakse. Ettevõtte juhatus vaatab kliendibaasi kogupilti ja näeb kogu tootespetsiifilist äririski regioonis või kliendisegmentides.

Kõik need kasutusviisid on lihtsasti nopitavad viljad, sest masinõppemudel arvutab asju mikrotasemel. Ülejäänud kasutusviisid on juba tavalise ärianalüüsi platvormi, näiteks Power BI vaadete genereerimise ja rakendamise küsimus masinõppemudeli väljastatavate toorskooride pealt.

 

Kokkuvõte

Ilmselt on ettevõtetes ikka kohti, kus on vajadus mikrotasandi prognooside järele, mille alusel soovitud sündmust/käitumist esile kutsuda või ebasoovitavat vältida. Edasi on tegemist juba praktiliste küsimustega: kas meil on üldse häid andmeid; kas neid on nii sündmuste esinemise kui ka mitteesinemise kohta; kas probleem on piisavalt suur, et hakata seda lahendama, ning kas potentsiaalne võit on nii selgelt tajutav, et oleme hea prognoosi nimel valmis oma äriprotsessi osaliselt ümber disainima. Kui jah, siis tasuks masinõppe katsetamise projekt töösse võtta.

 

Vaata lisaks ärianalüüsi lahendused: bi365.ee

Ärianalüüs CRM ERP Palk ja personal

Lühendite ERP, HRM, CRM ja BI virrvarr

Eelmine uudis

järgmine uudis

Palk ja personal

Juhtide ja ekspertide värbamine Leedus ja Lätis: Kuidas läheb meie naabritel

DIGITALISEERIMINE