Blog
Blog

Duivels data dilemma bij AI

04/02/2019
Betere gezondheid door betere informatie, dat wil iedereen. Toch staan jij en ik voor een duivels data dilemma. Een dilemma waarvan je waarschijnlijk het bestaan nog niet wist. Waar heb ik het dan over?

Artificial intelligence (AI) vereist training Nederlandse medische gegevens

Wat ik hoor is dat Nederlandse AI-leveranciers in de zorg naar het buitenland gaan om hun AI-software daar te trainen met de medische gegevens van het desbetreffende land. Ik stel mezelf de volgende vraag: vind ik software dat getraind is op basis van buitenlandse medische gegevens acceptabel? Wil ik gediagnosticeerd worden door slimme software die gevoed is met medische gegevens van inwoners van China? Nou nee. Mijn lichaam is niet vergelijkbaar met een Japanner, een Chinees of een Amerikaan. Hun leefgewoonten, anatomie, eetpatronen en woonomgeving zijn compleet anders. De smog in Peking is anders dan de omgevingslucht in mijn woonplaats Nootdorp. De lever van een gemiddelde Chinees werkt anders dan die van een gemiddelde Nederlander. Zelfs binnen Nederland kennen we lokale verschillen binnen een  populatie. Zo kent de populatie van het Maasstad Ziekenhuis een heel andere samenstelling dan de populatie van het ziekenhuis Nij Smellinghe.

Maar…

In Nederland zijn medische gegevens moeilijk verkrijgbaar en vanuit een wereldwijd perspectief is Nederland een klein land met weinig data. Leveranciers die AI-oplossingen bouwen, hebben last van deze beperkingen. Ze hebben namelijk een grote hoeveelheid en voldoende gestandaardiseerde medische gegevens nodig om hun AI-software te trainen. Daar komt bij dat medische gegevens versnipperd zijn opgeslagen in het zorgstelsel. Zo liggen mijn medische gegevens bij drie ziekenhuizen, twee huisartsen, een tandarts en twee fysiotherapeuten vast. En mijn digitale vaccinatiegegevens moeten ook ergens zijn ondergebracht. Dit vind ik persoonlijk niet erg.  Dit voelt veilig en dus goed. Ik zit als een bok op mijn medische haverkist. En gelukkig doen de security officers in de zorginstellingen dit ook namens mij. Mijn kijk op medische gegevens staat echter wel haaks op mijn visie om gegevens beschikbaar te stellen voor de ontwikkeling van AI.

Het dilemma

Tot vorige week was ik me er niet bewust van dat mijn persoonlijke ‘bok op de medische haverkist’-beleid de kwaliteit van de Nederlandse zorg in de weg zit. Wat wil ik nu? Óf bovenop mijn medische gegevens zitten en dan gediagnosticeerd worden met AI-software die getraind is in het buitenland? Óf gediagnosticeerd worden door AI-software die gebaseerd is op te weinig Nederlandse gegevens?

Om dit duivelse data dilemma te kunnen doorgronden, heb ik besloten om zelf een neuraal netwerk op te zetten. Ik heb oogfoto’s van internet geplukt en een uur later heb ik een simpel neuraal netwerk opgezet. Ik ben geen oogarts, in de verste verte niet. Maar ik kan opeens wel oogaandoeningen diagnosticeren. Althans, daar lijkt het op. Ik besef nu dat iedereen AI-oplossingen kan ontwikkelen, maar dan moet die spreekwoordelijke bok wel van de haverkist afspringen.

Mijn eigen gemaakte neuraal netwerk heeft mij duidelijk gemaakt dat ik groot voorstander ben van het beschikbaar stellen van mijn medische gegevens aan nationale en internationale bedrijven.  Maar let op, wel bedrijven die ik kan vertrouwen en die ethisch en maatschappelijk verantwoord bezig zijn. Maar hoe weet ik welke bedrijven dit zijn? Bedrijven die AI-toepassingen bouwen om de wereld beter te maken. Ik hoop dat ik deze optie kan aanvinken op mijn toestemmingsformulier. Kortom: ja, ik wil dat bedrijven met mijn medische gegevens AI-toepassingen ontwikkelen, mijn data mag de hele wereld rond zolang het maar niet herleidbaar is, veilig is en met de goede bedoelingen.