De opkomst van data science biedt veel mogelijkheden om problemen binnen je organisatie in kaart te brengen én op te lossen. Maar waar begin je? Frank de Nijs, enterprise innovator bij Centric, legt uit hoe je in negen stappen een succesvolle start maakt met data science.

 

1. Maak de businessuitdagingen inzichtelijk
“De eerste stap naar datagericht werken is helder krijgen waar de uitdagingen of problemen van je business liggen. Daarbij is het belangrijk om ook de achtergrond goed in beeld te hebben. Stel, een retailer wil zijn aanbiedingen tailormade en gepersonaliseerd maken, zodat consumenten niet overvoerd worden met acties waar ze niks aan hebben. Iemand met twee kinderen van 18 en 21 jaar zit bijvoorbeeld niet te wachten op een aanbieding van luiers. Hoe concreter het probleem in beeld komt, hoe waardevoller uiteindelijk de rol van data science.

 

2. Definieer de zakelijke kansen
“Wanneer je het probleem in kaart hebt gebracht, neem je de zakelijke gevolgen van dat probleem onder de loep. Waarom krijgen mensen verkeerde aanbiedingen en acties te zien? Kost het ons heel veel tijd om deze gepersonaliseerd te maken? Op die manier maak je duidelijk wat de zakelijke gevolgen zijn van je probleem, en hoe je er als organisatie op vooruitgaat als je dit probleem oplost.”

 

“Ga niet alleen op zoek naar interne data. Ga ook op zoek naar externe data”


 

3. Zoek naar de relevante data
“Voordat je aan een oplossing kunt werken, ga je op zoek naar data om te kunnen analyseren. Dat is een grote stap: je gaat namelijk bedenken welke factoren allemaal meespelen. En je moet niet alleen op zoek naar interne data, maar ook naar externe data. Denk aan weergegevens, maar ook aan veel andere databronnen. Dat betekent dat de data uit alle systemen moet worden ontsloten richting zogenoemde datalakes. Het is een uitdaging om dat op een goede gestructureerde manier te doen. En wanneer de data niet meteen voorhanden is, vraag je jezelf af: hoe kunnen we daar aan komen?”

 


 

4. Vind causale verbanden in je data
“Vanaf deze stap gaat data science daadwerkelijk een rol spelen, zeker bij grote hoeveelheden data. Je hebt allerlei gegevens verzameld en nu is het zaak om causale verbanden te ontdekken. Hoe je dat doet, hangt af van de hoeveelheid informatie die je hebt verzameld. Gaat het om 25 voorbeelden, dan kun je daar gewoon zelf statistiek op loslaten. Heb je veel externe contextuele databronnen of doe je onderzoek bij een groter bedrijf en zijn het er 1.500, dan wordt het een ingewikkelder verhaal.

Data science biedt allerlei technieken om enorme hoeveelheden data te analyseren. Je hebt bijvoorbeeld de Random Forest-methode, waarbij algoritmen zelf op zoek gaan naar verbanden. Dat doe je door het model eerst te trainen via een dataset en het vervolgens te verifiëren met een andere set. Tijdens die analyse kan een data scientist allerlei verbanden vinden. In het onderzoek naar gepersonaliseerd productaanbod kun je een profiel samenstellen van de verschillende bezoekers van een retailbedrijf.”

 

5. Evalueer de zakelijke waarde van deze verbanden
“Stel dat je in stap 4 een causaal verband ontdekt waarmee je kunt voorspellen welk type consument de winkel bezoekt. Dan kun je dus ook actie ondernemen om ervoor te zorgen dat alle aanbiedingen gepersonaliseerd worden. Vervolgens beoordeel je in deze stap de toegevoegde waarde van het model. De betrouwbaarheid van het model is vaak het eerste aandachtspunt, want 100 procent betrouwbaarheid is een utopie.

Daarbij is het ook belangrijk om er rekening mee te houden dat het onderhouden van je analysemodel tijd en geld kost. Hiermee ga je dus terug naar de allereerste stappen, waarin je het probleem in kaart bracht. Je maakt de afweging: wegen de baten van mijn oplossing op tegen de kosten?”

 

6. Breng je model in de praktijk
“Tot nu toe ben je bezig geweest om een model samen te stellen. In de vijfde stap heb je een afweging gemaakt: biedt mijn model een waardevolle oplossing voor het probleem? Zo ja, dan ga je in deze fase over tot actie. Het model ontgroeit de laboratoriumfase en wordt na instemming van de stakeholders in de praktijk toegepast. Je koppelt het analysemodel aan je operationele systemen. Dit zal stapsgewijs en onder begeleiding gebeuren, afhankelijk van de impact op de bedrijfsvoering en techniek, en van de ervaring met voorgaande implementaties. Zo is een DevOps-benadering ook voor data science een zeer voor de hand liggende werkwijze.”

 

“De betrouwbaarheid van het model is het eerste aandachtspunt, want 100 procent betrouwbaarheid is een utopie”

 

 

7. Laat gebruikers zelf ervaren wat het model doet

 

“Het model is gekoppeld aan, of geïmplementeerd in, de operationele systemen. Dit kan leiden tot nieuwe beslissingen, met hopelijk een beter resultaat als gevolg. In het onderzoek kan het dus zijn dat je informatie hebt gekregen over een consument die verkeerde aanbiedingen gepresenteerd krijgt. Het model laat de aanleiding zien en geeft opties om deze situatie te verbeteren.”

 

8. Leg nieuwe activiteiten vast en meet hun zakelijke gevolgen
“Belangrijk is nu ook om data te verzamelen over de daadwerkelijke invloed van het analysemodel op de werkvloer en de effecten daarvan. De praktijk is immers weerbarstiger dan de theorie en zonder meetgegevens over de effecten van je oplossing kom je niet tot verdere inzichten. Je gaat monitoren hoe het model en de organisatie zich vanaf nu manifesteren.”

 

9. Analyseer je data voor verdere stappen
“In deze laatste stap analyseer je de effecten van de oplossing die je hebt bedacht: is het probleem nu opgelost? Misschien merk je dat de signalering en adviezen vanuit het analysemodel dankzij een bepaalde ingreep nóg meer effect kunnen hebben en start je daarom een volgende verbeterslag. Bijvoorbeeld vanuit stap 3. Het kan ook zijn dat je juist op nieuwe problemen stuit en denkt: hier moeten we ook eens naar kijken (stap 1). Via zo’n methodische aanpak leidt datagericht werken tot nieuwe, diepere inzichten die een businessuitdaging behapbaar maken, in welke branche je ook zit.”

 


Frank de Nijs, enterprise innovator Centric

 

Trendrapport
Centric heeft bedrijven uit verschillende sectoren gevraagd naar hun redenen om data science in te zetten.Welke toepassingen zien zij? Waar zit de winst? 
Maar ook: Welke uitdagingen zijn er te overwinnen voordat je succesvol met data science aan de slag kunt? De antwoorden op deze vragen staan in het trendrapport.

 

Lees het trendrapport