Onderzoeksinstituten beschikken vaak nog niet over de infrastructuur die nodig is voor onderzoek met big data over personen. Ook schiet de kennis van wetenschappers over de juridische en ethische aspecten daarvan nog vaak tekort.
Ongekende mogelijkheden
Dat schrijft de Koninklijke Nederlandse Akademie van Wetenschappen (KNAW) in een nieuw advies over het gebruik van big data in wetenschappelijk onderzoek met gegevens over personen. Denk aan data over social media-gebruik of aan ‘personalized health’, waarbij genetische gegevens worden gecombineerd met gegevens over voeding, gedrag en omgeving.
Het gebruik van big data vraagt om nieuwe methoden en technieken. In een enorme databerg valt immers altijd wel een verband te ontdekken. Het risico dat de hypothese wordt opgesteld aan de hand van de resultaten, wordt daardoor groter.
Ook is er het gevaar dat de beschikbare data de onderzoeksvraag sturen in plaats van andersom waardoor er tunnelvisie kan optreden. Het is daarom belangrijk dat de wetenschappers vooraf een duidelijke theorie hebben opgesteld.
Curieuze kennis
Ook op het gebied van privacy en ethiek kunnen onderzoekers de mist in gaan. De gegevens blijven vaak herleidbaar tot personen wat tot curieuze, onbedoelde kennis kan leiden. De KNAW noemt als voorbeeld de Amerikaanse Thelma Arnold. Haar zoekgeschiedenis werd beschikbaar gesteld door haar provider en hoewel de gegevens waren geanonimiseerd bleek ze niet alleen makkelijk identificeerbaar, maar kwam de buitenwereld ook te weten dat haar hond een zindelijkheidsprobleem heeft.
Bovendien worden gegevens veelvuldig gedeeld en gecombineerd waardoor het uiteindelijk onduidelijk is wie er verantwoordelijk is voor het beschermen van de privacy van onderzochte personen.
Volgens de commissie moeten wetenschappers daarom nauwer samenwerken met dataspecialisten en ethische experts. Maar ze moeten ook zelf worden opgeleid in het gebruik van big data, zodat ze snappen waar de dataspecialisten het over hebben.
Omdat onderzoekers veilig moeten kunnen samenwerken met elkaar en met andere partijen moet het ministerie er bovendien voor zorgen dat er een landelijke infrastructuur komt voor het verzamelen, bewerken, delen en analyseren van big data over personen.