Afbeelding

Big Data

Algemeen Column

Ik zie de discussie over geheimhouding van onderzoeksresultaten met veel belangstelling tegemoet.

Kent u het magazine van Wageningen UR over werken aan de kwaliteit van leven?
Het blad heet Wageningen World. Mijn aandacht wordt getrokken door een artikel over big data. Nu hoor ik hier regelmatig over praten. Mijn collega's zijn razend enthousiast over de onbekende mogelijkheden die deze nieuwe manier van onderzoek in zich heeft. En eerlijk gezegd ik weet niet wat het is en besluit het stuk te lezen.

Alwetend
Ik leer al snel dat Big staat voor groot, maar de naamgeving is ook een verwijzing naar Big Brother, de alwetende overheid die volgens schrijver George Orwell al ons doen en laten zou gaan bepalen. Zou het dan echt zo ver kunnen komen dat er mensen zijn die ik niet eens ken meer van mij weten dan mijn vrouw? Mensen die op de hoogte zijn van mijn interesses door mij onophoudelijk digitaal te volgen, om vervolgens te handelen met deze opgedane kennis.
Ze kunnen zien welke webshops ik bezoek en welke dingen ik koop. Ook als ik surfend op het web oplossingen zoek voor vragen waar ik mee zit, kijken ze mee.
Is het dan echt zo dat mijn interesses en die van u op internet goud waard zijn? Het antwoord is ja, immers met al die gegevens wordt een profiel gemaakt, dat voor veel geld verkocht wordt aan een ieder die geïnteresseerd is. Denk dan aan marketeers, kredietbeoordelaars, verzekeraars en alle andere geïnteresseerden. Dat is wat mij betreft de negatieve kant van Big Data. 

We kunnen er niet omheen dat op tal van terreinen de hoeveelheid gegevens die digitaal worden opgeslagen en verwerkt met duizelingwekkende snelheid groeit.
Bijvoorbeeld op het gebied van DNA, maar ook dichter bij ons alledaagse leven. Moderne auto's geven dag in dag uit informatie door aan de fabrikant over onder meer toerental en de lengte van ritten. Interessante informatie om het onderhoudspakket op af te stemmen, maar ook handig voor studies naar bijvoorbeeld verschillen in rijgedrag. Leuk materiaal dus voor onderzoekers, maar ook voor verzekeraars.
In de databestanden van Google, grote winkelketens, sms, twitter of autofabrikanten ligt een schat aan kennis opgeslagen over onze voorkeuren. Voor snel optrekken bijvoorbeeld; waar we op internet naar zoeken; of wat we graag eten. Bij een analyse van Nederlandse twitterberichten bleek het woord broccoli vaak voor te komen in combinatie met wokken. Niet wereldschokkend, maar voor de groentesector een eyeopener over consumentengedrag. 

Gewasgroei
Op dit moment is het al zo dat moderne ICT wordt ingezet om met behulp van sensoren gewasgroei in de gaten te houden. Alle sensoren bij elkaar zijn een brij aan gegevens waarin nieuwe inzichten kunnen zitten die nieuwe inzichten en kennis kunnen genereren. Zeker als je databestanden kunt koppelen, aan productie, input aan resources en groei omstandigheden.
De verwachting is dat over tien jaar 80 procent van het onderzoek gebaseerd is op het analyseren en combineren van databestanden om zo nieuwe kennis te kunnen genereren. Om gewasgroei van onze teelten te beoordelen, zullen we in de nabije toekomst niet meer de kas in hoeven om waarnemingen te doen. Nu al kunnen wij via sensoren in de kas kijken en straks misschien wel door het inzetten van drone's nog veel meer gegevens binnen krijgen. En dan niet van enkele plekken in de kas maar van het hele gewas of misschien wel van elke plant in de kas. Voor dergelijke gegevensbergen draait de computer in principe zijn hand niet om. Koppel daaraan de gegevens over de hoeveelheid meststoffen, CO2 dosering, watergift, gewasbescherming , grondanalyses, weersgegevens, etc. en in een handomdraai is bekend hoe een bepaald gewas het doet onder welke omstandigheden. Nu nog moeten onderzoekers daarvoor jarenlang deelaspecten onderzoeken.

Macht
Uiteindelijk zal u als tuinder daarvan profiteren als al die kennis kan worden vertaald naar handzame adviezen. Om databestanden ook daadwerkelijk zo te kunnen benutten, moet er heel veel werk verzet worden en zijn grote investeringen nodig. Om computerprogramma's te ontwikkelen die redeneren en leren complexe vraagstukken op te lossen, heb je gecombineerde kennis nodig van computerdeskundigen en vakspecialisten. Datawetenschap wordt een nieuwe wetenschappelijke discipline waarbij onderzoekers en bedrijven uit meerdere disciplines betrokken zijn. 
Hiervoor is het wel nodig dat gegevens voor een ieder toegankelijk zijn. Anders hebben partijen met meer macht en geld de grootste controle. Openheid zorgt ervoor dat iedereen applicaties kan ontwikkelen en dat je als kweker niet van één partij afhankelijk bent die bijvoorbeeld zaaizaad, meststoffen of gewasbeschermingsmiddelen levert.

Daarom is het erg belangrijk dat publiek gefinancierde gegevens openbaar zijn zonder voorwaarden vooraf… 

Jan Willem de Vries

Teamleider Facilitair Bedrijf
(Wageningen UR Glastuinbouw)
 


 

Uit de krant

Meest gelezen

Uit de krant