Categorieën
artikelen

reCAPTCHA: Uitgebuit waar je bij staat

Of je nu wil inloggen op je Facebookprofiel of een bozig commentaar wil achterlaten op nujij.nl, vroeg of laat kom je ermee in aanraking: de ReCAPTCHA. Dit is een check om te zien of je geen robot bent die met een simpele brute force probeert om toegang te krijgen tot een profiel, of een spoor van spamberichten achter zich wil laten.

Oorspronkelijk waren de ReCAPTCHAs vrij eenvormige raadsels: licht vervormde teksten die je dan moest reproduceren. Minimale kans dat een robot dat zou kunnen nabootsen. Rond 2010 werd het ineens al een stuk eenvoudiger. Er kwam een grote knop met ‘ik ben geen robot’ voor in de plaats, waar je dan een vinkje bij moest zetten. De andere kant van de lijn maakt dan een scan van wat voor vlees er in de kuip zit – IP-adres, schermresolutie, browser –, en kan aan de hand daarvan bepalen of er al of niet een robot in het spel is.

Klinkt allemaal natuurlijk hartstikke nobel. Maar toch wringt er iets.

Tegenwoordig hoeft lang niet iedereen meer de ‘ik ben geen robot’-check te doen. Alleen bij twijfelgevallen – als het geregistreerde IP-adres bijvoorbeeld in verband gebracht wordt met eerdere online aanvallen – komt vaak de ReCAPTCHA om de hoek kijken. Een beetje als de rijen EU-burgers en niet-EU-burgers op een Europees vliegveld.

Op de site van Google, de (onvermijdelijke) beheerder van het ReCAPTCHA-mechanisme, staat het volgende wervende tekstje te lezen:

Millions of CAPTCHAs are solved by people every day. reCAPTCHA makes positive use of this human effort by channeling time spent solving CAPTCHAs into digitizing text, annotating images, and building machine learning datasets. This in turn helps preserve books, improve maps, and solve hard AI problems.

Door middel van raadsels helpt reCAPTCHA dus om de onoverkomelijke problemen die de kunstmatige intelligentie kent op te lossen. Plaatjes die door échte mensen zijn geïdentificeerd – verkeersborden en winkels van Google Street, onduidelijke woorden in gescande boeken van Google Books – worden gecompileerd tot mini-datasets, die op hun beurt worden gebruikt om machine learning-systemen te trainen.

Allemaal leuk en aardig, maar zien wij eigenlijk nog iets van de centen die aan het einde van de keten worden verdiend door ons totaal onvrijwillige trainen van die algoritmes van Google?

In chic Engels wordt het ook wel unpaid-for microlabour genoemd: telkens voer je héél kleine klusjes uit – het klikken op een link, het aanvinken van een vakje –, maar doordat aan de andere kant al deze microklusjes zich in miljoentallen ophopen, vormen ze toch een stevige taartpunt op de begroting. Terwijl jij geen cent terugziet van de gedane arbeid.

Het kwam al eerder ter sprake in de context van Facebook. Een bericht op dit medium behaalt meer ‘succes’ wanneer de like- en share-valuta rijkelijk vloeien. Voor Facebook zelf, de ‘beurs’ waarop de valuta wordt verhandeld, is het natuurlijk het beste wanneer er naarstig geliked en geshared wordt; op die manier wordt er meer ‘omzet’ gedraaid. De omzet van Facebook laat zich het beste naar de realiteit vertalen als de hoeveelheid tijd die de gebruiker op het medium spendeert, en de daarmee gepaard gaande informatie die Facebook aggregeert over de gebruiker: het medium kan die gebruikersinformatie op zijn beurt immers weer voor écht geld verhandelen.

Bij Facebook wordt het dus nog enigszins verhuld en witgewassen, maar in het geval van ReCAPTCHA is het gewoon keiharde uitbuiting: voor je verder mag met je leven, moet je even op de juiste vakjes klikken opdat onze machine learning-systemen geslepen worden. En die slimlerende robots gaan toch al op den duur al ons werk overnemen zodat wij straks thuis achter de geraniums moeten zitten, dus we worden gewoon gedwongen om mee te werken aan onze eigen ondergang. Ronduit stuitend, niet?

Niet zo lang geleden was precies hierom ook een zaak om aangespannen tegen Google. Hier zijn een paar lacherige nieuwsberichten over te vinden, vergelijkbaar met wat er vroeger op teletekstpagina 401 aan grappige nieuwtjes te vinden was. Maar over de afwikkeling daarvan is grappig genoeg niets meer te vinden! Waar zou dat mee te maken hebben: zou Google eieren voor zijn geld hebben gekozen met een stevige afkoopsom?