Minder is meer: de waarde van small data

Minder is meer: de waarde van small data

Conclusies baseren op basis van kleine datasets klinkt onbetrouwbaarder dan via bergen gegevens. Toch bieden small data inzichten die met big data vaak niet haalbaar zijn. “Big data-onderzoek is als vissen in een grote bak. Kleine datasets leveren verrassende informatie op.”

De opmars van big data is niemand ontgaan. Zeker nu steeds meer producten voorzien worden van een sensor – en de hoeveelheid informatie exponentieel toeneemt – blijft de dataficatie van de samenleving een gewild onderwerp van gesprek. Sinds het begin van de big data-trend breken verschillende analisten, onderzoekers en andere professionals echter een lans voor onderzoek op basis van kleinere hoeveelheden data.

Big data zijn waardevol voor het nemen van grote beslissingen zoals de locatie van een nieuwe winkel. Small data zijn echter een must om klanten over de streep te trekken, zei Gregg Aamoth, voormalig vicepresident customermarketing van Macy’s, eerder al in RetailTrends. Voor big data vormen nuttige informatie als demografische kennis, transactiedata en onderzoeksgegevens over het winkelgedrag van mensen de basis van een piramide. Daar bovenop komen...

Conclusies baseren op basis van kleine datasets klinkt onbetrouwbaarder dan via bergen gegevens. Toch bieden small data inzichten die met big data vaak niet haalbaar zijn. “Big data-onderzoek is als vissen in een grote bak. Kleine datasets leveren verrassende informatie op.”

De opmars van big data is niemand ontgaan. Zeker nu steeds meer producten voorzien worden van een sensor – en de hoeveelheid informatie exponentieel toeneemt – blijft de dataficatie van de samenleving een gewild onderwerp van gesprek. Sinds het begin van de big data-trend breken verschillende analisten, onderzoekers en andere professionals echter een lans voor onderzoek op basis van kleinere hoeveelheden data.

Big data zijn waardevol voor het nemen van grote beslissingen zoals de locatie van een nieuwe winkel. Small data zijn echter een must om klanten over de streep te trekken, zei Gregg Aamoth, voormalig vicepresident customermarketing van Macy’s, eerder al in RetailTrends. Voor big data vormen nuttige informatie als demografische kennis, transactiedata en onderzoeksgegevens over het winkelgedrag van mensen de basis van een piramide. Daar bovenop komen data uit loyaltyprogramma’s en kennis over voorkeuren van individuele klanten. Hoe verder naar de top, hoe kleiner het datavolume, maar hoe groter de waarde. En des te minder is de informatie afkomstig uit datasets op basis van anonieme bronnen ver buiten de organisatie, maar gewoon uit het bedrijf zelf.

Picnics aanpak
App-only supermarkt Picnic paste small data-onderzoek onlangs toe. De speler ging bij klanten thuis langs en vroeg simpelweg naar hun ervaringen. De exercitie nam slechts twee avonden in beslag, maar leverde een schat aan nieuwe inzichten op, stelt medeoprichter Frederik Nieuwenhuys in het Financieele Dagblad. De informatie is bovendien waardevoller dan de statistieken die tegenwoordig de norm zijn. Dat neemt overigens niet weg dat Picnic data-engineers in dienst heeft. De aanleiding voor de actie was echter dat het e-commercebedrijf in zijn jonge bestaan nog niet voldoende informatie heeft verzameld om over big data te kunnen spreken. Vandaar het besluit om zijn vragen over bezorgmomenten direct aan een select aantal klanten voor te leggen. Met ‘the right data’ als resultaat, in de woorden van Nieuwenhuys. Big data-sets bevatten volgens hem veel ruis en leiden daarmee tot onbetrouwbare uitkomsten.

Het ontbreken van een flinke hoeveelheid kwalitatief hoogwaardige data blijkt een van de voornaamste redenen om small data-onderzoek in te zetten. “Je moet goed het onderscheid maken tussen luiheid en datasets die echt niet groter kunnen zijn”, stelt statisticus Rens van de Schoot. Hij is als onderzoeker verbonden aan Universiteit Utrecht en werkt veel met kleine datasets. “Misschien zijn er maar weinig klanten die je vragen kunt stellen. Dus moet je eerst doorvragen waarom de dataset zo klein is. En zo’n beperkte set is misschien juist wel een uniek pareltje dat je inzichten geeft die je op geen andere manier bereikt.”

Als de hoeveelheid beschikbare empirische data klein is, kan het lonen om deze aan te vullen met de kennis van de onderzoeker, wetenschapper of een andere betrokkene uit het bedrijf. Zoals de ceo. Van de Schoot noemt een onderzoek naar de verwachte omzetgroei van een organisatie als voorbeeld. Daarbij kunnen experts een bandbreedte noemen waar de omzet binnen blijft. Denk aan een miljoen plus of min. “Dan kun je bepaalde resultaten wegsnijden en gerichter onderzoeken.” Maar, benadrukt hij, het is dan zaak om open en transparant te zijn over de aanpak. Ook het wegsnijden van die resultaten – hoe voor de hand liggend ook – beïnvloedt immers je uitkomst. Het vraagt dus om verantwoording.

Valkuilen
Hoewel small data tegenwoordig dus weer meer aandacht krijgen, waarschuwen critici regelmatig voor de bias die kan optreden. De informatie die je kiest is van grote invloed op de uitkomst doordat je maar naar een beperkte set aan informatie kijkt. Dat maakt de keuze voor je data bijzonder belangrijk. Een herkenbaar beeld voor Van de Schoot. Onderzoek kent zijn oorsprong in vragen willen beantwoorden uit nieuwsgierigheid, schetst hij. Doordat tegenwoordig zakelijke belangen bij veel onderzoeken meespelen, is er echter een verschuiving naar commerciële relevantie. Organisaties wenden onderzoeken in toenemende mate aan om te bevestigen of een product of dienst het goed heeft gedaan. Een risicovolle situatie. “Een data-analist kan aan heel veel knoppen draaien, totdat er een gewenst beeld ontstaat. Zijn keuzes kunnen net goed uitpakken voor het bedrijf in kwestie. Dan is het geen pure wetenschap meer, maar cherry picking.”

Weet wat je vraagt
Een groot deel van Van de Schoots werk is dan ook onderzoekers helpen de juiste vragen te stellen. Bij kleine data is dat nog veel belangrijker dan bij big data, stelt hij. Want bij grote datasets kun je links- of rechtsom immers niet om een uitkomst heen. Kleine datasets zijn wat dat betreft een stuk subjectiever. “Het is daarbij heel verleidelijk om de resultaten te bekijken voor je keuzes maakt”, stelt Van de Schoot. Maar dat beïnvloedt de keuzes te veel. “Ik raad dat daarom enorm af.” Veel data-analisten durven volgens Van de Schoot vooral niet aan small data-onderzoek te beginnen, uit angst niet serieus genomen te worden. Onnodig, meent hij. “Big data-onderzoek is als vissen in een grote bak, een meer passieve manier van onderzoeken. Met kleine datasets moet je je actiever opstellen en kom je veel onverwachtere data tegen.”

Het is belangrijk je te realiseren dat onderzoek op kleine schaal vooral een goed startpunt kan zijn, benadrukt de statisticus. “Met een grote dataset kun je in één keer een vaststelling doen. Kleine sets zijn vooral geschikt om je eerste stap te zetten. Zo doe je nieuwe inzichten op die je weer verder kunnen helpen.” Hoewel het dus risicovol blijft om grote conclusies te trekken uit dergelijk onderzoek, kan het nuttig zijn om onderzoeken te stapelen: verschillende kleine onderzoeken combineren. “Maar dan moeten het wel allemaal pareltjes zijn.”

Kenmerkend lijkt in ieder geval dat analisten bij small data starten vanuit een duidelijke doelstelling. Denk aan het beter begrijpen van koopgedrag, concurrenten beter kunnen volgen of willen weten welke invloed economische ontwikkelingen hebben op een bepaalde productgroep. Uit die doelen komt een behoefte aan informatie voort, zodat je die gericht kunt zoeken. Uiteraard met de wetenschap dat small data het nut van big data niet uitsluiten. Integendeel: over small data wordt wel gesteld dat ze mensen kunnen helpen big data beter te plaatsen. Small data-onderzoek lijkt soms dus uit nood geboren, maar is in de praktijk juist een middel om evidencebased te werken. Zonder ruis op de lijn.

Bron: RetailTrends 4

Dit is een premium artikel

Verder lezen?

Sluit je net als 2.500 bedrijven aan bij de RetailTrends-community

Slechts €10 voor de eerste maand

Word member van RetailTrends en krijg;
✅ toegang tot alle premium content;

✅ het RetailTrends-magazine (print + online);

✅ net als 40.000 nieuwsbriefabonnees dagelijks het laatste nieuws in je mailbox;

✅ gratis vacactureplaatsingen op RetailTrends Jobs;

✅ korting op RetailTrends-events.

Altijd op de hoogte van de laatste trends in de retailsector.

Schrijf je nu in voor de nieuwsbrieven van RetailTrends.

Er staan fouten in het formulier. Corrigeer je invoer en probeer het opnieuw.

Vul uw wachtwoord nogmaals in ter controle.

Je bent toegevoegd aan onze mailinglijst!