Nieuws

“Er zit goud in big data, maar er zijn te weinig mijnwerkers” intreerede prof.dr.ir. Bernard Veldkamp

Big data hangen al jaren als een belofte boven de markt in de sociale wetenschappen, maar vooralsnog hebben ze hun belofte niet waargemaakt. In zijn intreerede aan de Universiteit Twente die onderzoeksmethodoloog prof. dr. ir. Bernard Veldkamp op 22 maart uitspreekt, legt hij uit waarom en komt hij met oplossingen. De kern: we moeten op een andere manier met dit soort data omgaan. “De waarom-vraag moet plaatsmaken voor het interpreteren van patronen.” 

Er is momenteel een revolutie aan de gang op het gebied van de hoeveelheid data. Onder meer door de opkomst van het internet, sociale media, mobiele telefoons en allerhande sensoren stijgt deze elk jaar met maar liefst veertig procent. Voor sociale wetenschappers, die zich bezighouden met het gedrag van individuen en groepen, kunnen deze enorme hoeveelheden data een goudmijn zijn. Maar, ook al hangt de belofte van big data al jaren als een belofte voor de sociale wetenschappen boven de markt, toch heeft de analyse ervan de verwachtingen geenszins waargemaakt. Hierdoor slaat het enthousiasme langzaam om in scepsis. Ondertussen gaan informatici die methodes ontwikkelen om de data te analyseren, er met de buit vandoor. Belangrijk nadeel is echter dat informatici, gezien hun achtergrond, onvoldoende rekening kunnen houden met de context en de materie die ze bestuderen. Hierdoor is de bruikbaarheid van hun bevindingen beperkt. 

Kloof dichten

Het is volgens Veldkamp tijd voor een paradigmawisseling. Als een van de belangrijkste redenen waarom de sociale wetenschappers de eerste slag verloren hebben, noemt hij het gegeven dat ze te lang hebben geprobeerd om met traditionele methodes de data te verwerken en te analyseren. Maar, hiervoor is de hoeveelheid data simpelweg te groot. Bovendien – misschien nog belangrijker – is er sprake van een compleet ander soort data dan die voorheen beschikbaar was. Omdat de data – in tegenstelling tot data uit traditionele steekproeven, observaties of vragenlijsten – niet specifiek verzameld zijn voor wetenschappelijke analyse, is de oorsprong en de kwaliteit lang niet altijd duidelijk. Of, zoals Veldkamp het kort zegt: “Er zit enorm veel ruis in.” Daarom is het volgens hem van groot belang om een andere aanpak te kiezen. Het vakgebied van de onderzoeksmethodologie, hét vakgebied van Veldkamp, is bij uitstek geschikt om de kloof tussen big data en de sociale wetenschappen te dichten. “Er zit goud in die data, maar er zijn momenteel te weinig gekwalificeerde mijnwerkers om het te ontginnen.” 

Patronen

Dat de oorsprong van de data soms onbekend is en dat er veel ruis in kan zitten, hoeft volgens Veldkamp niet per se een probleem te zijn; je moet er alleen wel rekening mee houden bij je analyse. Big data bieden, juist door die grote hoeveelheid, de mogelijkheid om onzekerheden statistisch te corrigeren. Daarnaast is het volgens Veldkamp noodzakelijk om de ruis ‘mee te modelleren’. Dit houdt in dat je voorzichtiger moet zijn met aannames en dat je minder harde conclusies kunt trekken. Veldkamp: “Daarom wordt het belangrijker om te kijken naar de interpretatie van verbanden, dan naar causaliteit. Of, in simpelere woorden,: de waarom-vraag moet plaatsmaken voor het interpreteren van patronen.” 

Het wordt belangrijker om te kijken naar de interpretatie van verbanden, dan naar causaliteit. Of, in simpelere woorden,: de waarom-vraag moet plaatsmaken voor het interpreteren van patronen.

Bernard Veldkamp

Veldkamp studeerde en promoveerde aan de Universiteit Twente en bekleedde er vervolgens verschillende wetenschappelijke functies. In 2014 werd hij er hoogleraar en in 2015 voorzitter van de vakgroep Onderzoeksmethodologie, Meetmethoden en Data-Analyse. Hij past zijn methodes toe op tal van terreinen: van onderwijskunde tot psychologie en van fraudedetectie tot spraakherkenning. Op 22 maart sprak hij om 16.00 uur zijn openbaar toegankelijke intreerede uit in de Prof.ir. M.P. Breedveld-zaal van gebouw de Waaier op de campus van de Universiteit Twente.