Corresponding author: Tom Groot ( t.groot@vu.nl ) Academic editor: Chris Knoops
© 2018 Tom Groot.
This is an open access article distributed under the terms of the Creative Commons Attribution License (CC BY-NC-ND 4.0), which permits to copy and distribute the article for non-commercial purposes, provided that the article is not altered or modified and the original author and source are credited.
Citation:
Groot T (2018) De belofte van Big Data. Maandblad Voor Accountancy en Bedrijfseconomie 92(5/6): 143-146. https://doi.org/10.5117/mab.92.26691
|
Big data is een containerbegrip en dat maakt het moeilijk om precies te omschrijven waar we het nu over hebben. Data is de grondstof voor informatie, big data zijn gegevens die aan vier kenmerken voldoen: een groot volume, hoge omloopsnelheid, grote variëteit en onzekere waarheidsgetrouwheid. In het Engels spreekt men ook wel van de vier V’s: huge volume, high velocity, huge variety, and uncertain veractity (
De McKinsey Advanced Analytics-groep heeft op basis van een onderzoek onder meer dan 100 data analytics-projecten in bedrijven een inschatting gegeven van de mate waarin zij de bedrijfsprestaties in een periode van drie jaar kunnen verbeteren (
Bewezen waardecreatie op basis van Data Analytics.
Opbrengstverhoging (top line growth) | Kostenverlaging (bottom line reduction) | |||
---|---|---|---|---|
Maatregel | Geschat effect | Maatregel | Geschat effect kostenreductie | |
op omzet | op marge | |||
Optimaliseren productenpakket | 2,0 % | 1,0 ppt *) | Preventief onderhoud | 20–00% van onderhoudskosten |
Cross- en Upselling van producten | 2,0 % | Marketing uitgaven | 5–50% van marketingkosten | |
Vasthouden bestaande klanten | 1,5 % | Voorspelling afzet | 20–00% opslag- kosten | |
Prijsstelling | 2,0 % | 1,0 ppt | Voorkomen van fraude | 1–1% van verlies door fraude |
Verbeteren voorraadbeheer en bestellingen | 2,0 % | 0,5 ppt | Beheer dubieuze debiteuren | 10–00% van verliezen door oninbaarheid |
Optimaliseren product-promotie | 1,5 % | 1,0 ppt | Planning inzet personeel | 10–00% van personeelskosten |
Optimaliseren gebruik ruimte en opslag | 1,5 % | Optimaliseren van de supply chain | 10–00% van logistieke kosten |
Tevens valt op dat de maatregelen betrekking hebben op verschillende bedrijfsfuncties. Zo zien we verbeteringen in productsamenstelling, marketing (bundeling van producten, prijsstelling en promotie), logistiek (voorraadbeheer en ruimtegebruik), procesmanagement (onderhoud en optimaliseren supply chain), financiën (beheer dubieuze debiteuren en voorkómen van fraude) en personeelsmanagement. Hieruit wordt ook duidelijk hoezeer Big Data-analyse functie-overschrijdend kan werken.
Er is nog een andere verandering die Big Data teweeg brengt en dat is de wijze van probleemoplossing. In het algemeen zijn we getraind om problemen op een systematische wijze op te lossen, waarbij de te volgen stappen in een logische volgorde worden afgewerkt. Men begint met een probleemdefinitie, kiest een analysemethode en daarbij behorende data, en genereert een (zoveel mogelijk geoptimaliseerde) oplossing. Dit is een recht-door-zee, lineaire oplossingsstrategie. Bij Big Data werkt de aanpak veelal minder lineair en meer iteratief. Dit is goed zichtbaar gemaakt in het Cross Industry Standard Process for Data Mining (CRISP-DM) dat veelvuldig wordt gebruikt in data mining-projecten (
De data mining-processen volgen een overeenkomstige structuur. Allereerst dienen data voor analyse bereikbaar te worden gemaakt. Dit kan op veel verschillende manieren, bijvoorbeeld door het automatiseren en robotiseren van (administratieve) processen. De verschillende databronnen moeten met elkaar in verbinding worden gebracht door het gebruik van data warehouses. Die bronnen kunnen kwantitatieve datasets zijn, maar ook tekst, beeld- en geluidopnames. Vervolgens kunnen verschillende technieken worden gebruikt om data te verkennen, zoals descriptieve statistische analyses (gemiddelde, modus, mediaan en spreiding), visuele dataverkenningstechnieken met een graphical user interface (GUI) zoals OLAP (on-line analytical processing) en queries die kenmerken genereren van deelpopulaties (bijvoorbeeld: wat zijn kenmerken van onze klanten die na één aankoop niet meer bij ons terugkeren?). Een stap verder gaan segmentatie-, classificatie- en clustering-technieken die pogen samenhangen in datasets zichtbaar te maken. Zo kan men proberen te achterhalen welke factoren meespelen in het succes van opvallend goed-scorende verkoopmedewerkers. Deze technieken worden vooral inductief en verkennend gebruikt: men probeert verbanden op te sporen die voorheen nog niet bekend waren. Ten slotte zijn er de associatie-technieken die beogen veronderstelde verbanden te vinden. Te denken valt aan correlatie en verschillende varianten van regressieanalyse. Vooral in deze laatste categorie vinden we de gebruikelijke statistische technieken die in de huidige bedrijfseconomische opleidingen worden onderwezen.
Uit dit overzicht blijken big data niet alleen nieuwe mogelijkheden te openen, maar ze stellen ons ook voor nieuwe uitdagingen. Door de grote variëteit en veranderlijkheid van data is een extra aandachtspunt de grote variatie in datadefinities en databetrouwbaarheid. Dit is een onderwerp waarop accountants goede diensten kunnen bewijzen: ze zijn immers getraind in het beoordelen van consistentie en betrouwbaarheid van gegevens. Een andere uitdaging is het goed kiezen van bedrijfsproblemen die door big data kunnen worden opgelost. Uit de opsomming van verbeteringsmogelijkheden van McKinsey wordt duidelijk dat big data voor elke bedrijfsfunctie relevant kan zijn. Management accountants zijn bij uitstek in staat om deze specifieke bedrijfsproblemen hun plaats te geven in de totale planning en control-cyclus van de gehele organisatie. Dit kan helpen bij een goede prioriteitsstelling: welke problemen zijn het meest belangrijk en hoeveel middelen kunnen worden ingezet voor de oplossing hiervan? Ten slotte dient voldoende kennis in huis te zijn om de geavanceerde analysetechnieken op een verantwoorde manier toe te passen. Zo is het van groot belang om analysemethoden te gebruiken die passen bij het bedrijfsprobleem dat moet worden opgelost. Grote datasets en geavanceerde data-analysemethoden stellen ons voor weer nieuwe problemen. Datasets met veel waarnemingen vergroten de kans op het vinden van “false positives”: verbanden en verschillen die statistisch significant zijn, maar vooral berusten op toeval. Bouwers en gebruikers van modellen dienen een scherp oog te houden voor het onderscheid tussen nonsense-verbanden en betekenisvolle relaties. Een ander bekend probleem is het risico van “overfitting”: er is momenteel geen beperking meer aan de complexiteit van big data-modellen. Hierdoor kunnen ze met veel verschillende omstandigheden rekening houden. Modellen worden op een specifieke dataset ontwikkeld (de zogenaamde “trainingdata”) zodat ze alle kenmerken van die dataset goed weergeven. Echter, een model met een goede representativiteit van trainingdata hoeft nog niet in staat te zijn generaliseerbare uitspraken over nieuwe gevallen te doen (de “use data”). Misschien hebben nieuwe gevallen wel kenmerken die niet in de trainingdata voorkomen. Een complex model dat goed rekening houdt met de specifieke kenmerken van de trainingdata en niet goed de doelvariabele van nieuwe, nu nog onbekende gevallen voorspelt is “overfitted”. Ontwikkelaars moeten dus een afweging maken tussen betrouwbaarheid van modellen in de testfase en generaliseerbaarheid voor nieuwe gevallen. Hiervoor is inhoudelijke kennis van het vakgebied nodig en technisch inzicht in de werking van data analytics-methoden. Er zijn momenteel weinig goed opgeleide bedrijfskundigen die aan deze eisen voldoen.
Een laatste uitdaging geldt de beroepsgroep van accountants. Zoals uit het voorgaande duidelijk wordt is juist voor management accountants, controllers en auditors een grote taak weggelegd. Zij zijn bij uitstek in staat om de integriteit van gegevens te beoordelen, relevante gegevens te selecteren voor de interne besluitvorming en beheersing, en de betrouwbaarheid en volledigheid van de verslaggeving te bewaken. Zij zouden in de ontwikkelingen van big data in bedrijven een richtinggevende rol kunnen spelen. Het kan best zijn dat accountants nu al in specifieke bedrijfssituaties een belangrijke bijdrage leveren. Er bestaat echter weinig inzicht in de rol die accountants in deze ontwikkeling spelen. In de wetenschappelijke literatuur zien we verontrustend weinig ontwikkelingen op dit gebied. Een notoire uitzondering is een speciale editie van Accounting Horizons (twee zeer lezenswaardige bijdragen zijn
Prof. dr. T.L.C.M. Groot is hoogleraar Management Accounting aan de Faculteit Economie en Bedrijfskunde van de Vrije Universiteit Amsterdam.