data_analyse

Big data – Wetenschappelijke analyse.

In dit vierde  artikel in de serie over Big Data, staat de analyse van data  centraal. Waar de klassieke wetenschappelijke methode via hypotheses, causale verbanden zoekt, wordt binnen Big data gezocht naar trends, die vaak zijn gebaseerd op correlatie.

Wetenschappelijke methode.
De traditionele manier van data analyse kent zijn basis in de wetenschappelijke methode. De wetenschappelijke methode is een systematische manier om kennis te vergaren. De methodes variëren tussen de formele, empirische of sociale wetenschap, maar ook daarbinnen is de nodige discussie en verandering van inzichten.  Toch moet altijd in de publicatie van de resultaten de werkwijze rationeel verantwoord worden, waardoor toetsing van werkwijze en resultaat mogelijk is.

Causaal of correlatie.
Bij de analyse van Big data wordt er vooral gezocht naar trends en ontwikkelingen op grond waarvan men voorspellingen probeert te doen. Bij deze analyses wordt vaak niet de grondslagen van wetenschappelijke toetsing gebruikt, waardoor er een grote kans is dat een correlatie tussen 2 gegevensgroepen wordt aangezien voor een causaal verband. In de statistiek spreekt men van correlatie als er een min of meer (lineaire) samenhang blijkt te zijn tussen twee reeksen metingen of de mogelijke waarden van twee toevalsvariabelen. De sterkte van deze samenhang wordt beschreven met de correlatiecoëfficiënt.

Een bekende vorm van correlatie is deze van mensen die gewelddadige films kijken en zelf gewelddadig gedrag vertonen. De vraag is: wordt een mens  gewelddadig van de film, of kijken gewelddadige mensen naar gewelddadige films. Wetenschappelijk onderzoek heeft later aangetoond dat er geen causaal verband is. De oorzaak van het gedrag moet elders gezocht worden.

Van causaal verband is sprake als gebeurtenissen plaatsvinden als gevolg van bepaalde andere gebeurtenissen die daaraan vooraf gegaan zijn; een oorzaak gaat vooraf aan een gevolg. In het algemeen moet aan drie voorwaarden voldaan worden vooraleer men over causaliteit kan spreken:

  • Covariatie of correlatie: beide variabelen veranderen altijd samen
  • De oorzaak komt voor het gevolg
  • Eliminatie van alternatieve hypothesen: geen “derde” variabelen, zoals moderators of mediators.

Onderscheidend belang.
Om terug te komen op de gewelddadige films. In de Verenigde Staten steekt van tijd tot tijd de discussie de kop op, of gewelddadige films, muziek en andere ‘gewelddadige uitingsvormen’ niet aan banden moet worden gelegd. Daarbij wordt verwezen naar onderzoeken die de correlatie aantonen, maar niet een causaal verband. Dergelijke inperking van de vrijheid van meningsuiting cs, betekent een fundamentele aantasting van een grondwettelijk recht.  Als dergelijke beslissingen genomen worden op grond van correlatie, leveren we veel vrijheid in, maar het verbod levert uiteindelijk niets op, omdat er geen causaal verband is.

Aangezien Big Data steeds belangrijker wordt bij het nemen van strategische business beslissingen, is het van groot belang dat de conclusies die getrokken worden, wel gebaseerd is op een juiste wetenschappelijke analyse die oorzaak en gevolg definieert. Toevallige relaties kunnen tot volstrekt verkeerde beslissingen leiden, wat de continuïteit van een organisatie kan aantasten.

Dus naast alle technologische oplossingen om data te verzamelen, zal er binnen organisaties ruimte en aandacht moeten komen voor statistici en bijvoorbeeld econometristen die goede analyses kunnen maken om te voorkomen dat organisaties op het verkeerde been worden gezet.

Bronnen:
Big Data, Communities and Ethical Resilience: A Framework for Action By 2013 Bellagio/PopTech Fellows Kate Crawford, Gustavo Faleiros, Amy Luers, Patrick Meier, Claudia Perlich and Jer Thorp. Draft Date: Oct. 24, 2013
Monroy-Hernandez, A., E. Kiciman, D. Boyd, and S. Counts. 2012. Tweeting the Drug War: Empowerment, Intimidation, and Regulation in Social Media. HCIC. [online] URL: http://research.microsoft.com/apps/pubs/default.aspx?id=168809
Robertson, J. 2013. How big data Could Help Identify the Next Felon – Or Blame the Wrong Guy. [online] URL: http://www.bloomberg.com/news/2013-08-14/how-big-data-could-help-identify-the-next-felon-or-blame-the-wrongguy.html
For example, see Solove, D. 2011 Nothing to Hide: The False Tradeoff Between Privacy and Security. New Haven: Yale University Press.
For example, see the Fair Information Practice Principles: http://www.ftc.gov/reports/privacy3/fairinfo.shtm
Crawford, K., and J. Schultz. 2013. big data and Due Process: Towards a Framework to Redress Predictive Privacy Harms. Boston College Law Review. 55(1). [online] URL: http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2325784
https://nl.wikipedia.org/wiki/Wetenschappelijke_methode

1 antwoord

Plaats een Reactie

Meepraten?
Draag gerust bij!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *