vrijdag 1 januari 2021

Innocent bijstander

De kans dat ik fraude pleeg is op een schaal van 0 (weinig) tot 1 (veel kans) 0,236602119. Dat heeft een commercieel marketingbureau in Amsterdam voor mijn gemeente uitgerekend. Dit moet ik uitleggen. 

Door omstandigheden kan ik niet - tenminste niet altijd - volledig in mijn levensonderhoud voorzien. Daarom ontvang ik regelmatig een aanvullende lening van de sociale dienst. Die bijstand moet ik volledig terugbetalen als ik weer inkomen heb - of dat nou komt van werk, AOW, het winnen van de loterij of het verkopen van mijn huis. Het komt er dus op neer dat ik mijn huis opeet. Gelukkig heb ik een lekker huis. 

Hoewel ik uiteindelijk dus zelf mijn eigen bijstand betaal - of te zijner tijd de kinderen van de kopers van mijn huis, het is maar hoe je het bekijkt - moet ik wel voldoen aan alle regels van de bijstand. Dat begrijp ik ook wel. En dus wil de gemeente - of in dit geval de gemeenschappelijke sociale dienst Werk en Inkomen Lekstroom (WIL) in Nieuwegein - weten of ik niet per ongeluk expres fraudeer. Daarom moet ik elk jaar zo'n 125 pagina's (over 2019 waren het 45 bijlagen) aan financiële gegevens inleveren voor controle. Daar is een ambtenaar heel wat tijd zoet mee. Alle ontvangsten moet ik melden, ook hulp en giften, of potentiële inkomsten zoals vrijwilligerswerk. Ook moet ik het laten weten als ik niet thuis slaap en een voorgenomen vakantieverblijf moet ik vier weken tevoren aanvragen. Bij een heronderzoek zijn ambtenaren bij mij op bezoek geweest, zij hebben in mijn koelkast, bed en slaapkamer gekeken en daar vragen over gesteld. Onderzoeken en controles waar ik overigens voluit aan meewerk. 

Daarnaast liet de sociale dienst tot vorig jaar juni de kans dat iemand fraude pleegt, onderzoeken door marketingbureau Totta Data Lab in Amsterdam. Dit was een ideetje van Totta zelf. Totta was op zoek naar een gemeente om samen een methode uit te werken voor fraudebestrijding. Via Mireille van Donselaar, beleidsadviseur van de gemeente Houten, kwam Totta in 2015 in contact met de nieuw opgezette gemeenschappelijke sociale dienst WIL. Het marketingbureau wilde software kunnen ontwikkelen waarmee gemeenten effectiever en goedkoper fraude konden opsporen. WIL wilde daar wel aan meewerken. 

Werk en Inkomen Lekstroom dumpte vervolgens van tijd tot tijd de gegevens van alle bijstandtrekkers van Nieuwegein, Houten, Lopik, IJsselstein en Vianen in een grote pan van Totta in Amsterdam en uit die soep van gegevens rolde dan per persoon een fraudescore. WIL kon daarna de topscorers aan een fraudeonderzoek onderwerpen. Dit bleek niet zo efficiënt als gedacht, want halverwege 2019 is WIL vanwege personeelsgebrek met deze onderzoeken gestopt en per 1-1-2020 is het contract met Totta beëindigd. 

Hoewel ik zelf in de bijstand zat, kwam ik er pas in 2018 achter dat mijn gegevens regelmatig met een marketingbureau in Amsterdam werden gedeeld, toen ik las dat de Amsterdamse VVD-fractie hierover raadsvragen stelde. De VVD wilde het systeem ook voor Amsterdam, maar het College van B&W wees dat af met het antwoord: "De basis van de dienstverlening aan bijstandsgerechtigden is vertrouwen. Het college hecht ook grote waarde aan de privacy van de burger en de wijze waarop diens gegevens door de overheid worden gebruikt, bijvoorbeeld voor het ontwikkelen van algoritmes. Het college vindt het van groot belang dat gebruik van datamining en algoritmes geen negatieve invloed heeft op de privacy van de bijstandsgerechtigde en diens rechtsbescherming."

Sindsdien volg ik het onderwerp ook voor Omroep Houten. Het voornemen was om via een WOB-verzoek informatie op te vragen over het systeem en de gebruikte algoritmes, maar omdat in Houten alles om windmolens draait, ging een WindWOB voor. Kort daarna, in 2019, ging de NOS aan de slag met het onderwerp, deed een WOB-verzoek bij WIL en berichtte daarover in het Journaal

Op 5 februari 2020 zette de rechtbank van Den Haag een streep door een ander systeem van de overheid, namelijk SyRi (Systeem Risico Indicatie). Daardoor kwam het gebruik van algoritmes voor fraudeonderzoek opnieuw in de belangstelling, maar toen was WIL al gestopt met Totta en daarmee werd een principiële discussie over het onderwerp vermeden. Op dit moment is de aandacht gericht op de gemeente Nissewaard (Spijkenisse), die nog met het systeem van Totta werkt en daarover veel vragen krijgt. De FNV stelde een modelbrief op waarmee bijstandontvangers met een beroep op de AVG hun gegevens kunnen opvragen bij de sociale dienst. Daar heb ik handig gebruik van gemaakt. 

Op 19 augustus 2020 heb ik bij WIL een verzoek ingediend tot inzage in de data-analyse van Totta over mijn persoon. WIL liet mij weten dat het antwoord veel tijd zou kosten. De data lagen klaar in een grote bulk spreadsheets, maar zonder toelichting zijn deze onbegrijpelijk. WIL heeft er inderdaad veel werk van gemaakt door de data in de spreadsheets cel voor cel te verklaren en daarbij nog een brief van zes kantjes te voegen met uitleg. Op 31 oktober ontving ik het antwoord per koerier in een dikke envelop. 

Omdat WIL in juni 2019 al gestopt was met Totta, is een deel van de gegevens inmiddels - terecht - vernietigd. Daar kan ik dus geen inzage in krijgen. Ook de tabellen die niet direct op mij van toepassing zijn maar de defaultwaarde 0 bevatten, krijg ik niet. De beslisbomen voor het berekenen van de fraudescore blijven ook geheim. 

WIL licht dit toe: het is belangrijk dat uitkeringsfraude, een strafbaar feit, zoveel mogelijk wordt voorkomen, onderzocht, opgespoord en vervolgd. Het openbaar maken van alle factoren die van belang zijn voor het bepalen van de fraudescore, zou mogelijkheden bieden om nog intelligentere en geraffineerdere manieren te vinden voor misbruik of fraude.

Verder legt WIL uit: de ontwikkeling van het model begon met het maken van een algoritme dat volledig gebaseerd was op de bij WIL bekende data van cliënten. Met behulp van dit algoritme werd voor alle ontvangers van een uitkering voorspeld wie een grotere kans heeft op frauduleus gedrag en wie niet. De voorspellingen werden gecontroleerd en teruggekoppeld naar het model, waardoor het model steeds nauwkeuriger werd ('machine learning'). 

WIL: "Ter illustratie lichten we de logica van drie veel voorkomende risico-indicatoren toe, te weten leeftijd, aantal kinderen en duur van de uitkering." 
Leeftijd. Het blijkt dat naar mate mensen ouder worden zij in het algemeen minder vaak onrechtmatig handelen en jongere mensen hebben vaker te maken met wijzigingen in hun levenssituatie, waarover zij de gemeente mogelijk niet correct informeren. 
Aantal kinderen. Het aantal kinderen kan invloed hebben op het aantal wijzigingen in de uitkering, waarover de gemeente mogelijk niet correct wordt geïnformeerd, wat kan leiden tot onrechtmatigheden of fraude. 
Duur van de uitkering. Mensen die slechts kort in de uitkering zitten, hebben gemiddeld genomen met minder wijzigingen te maken dan personen die er al langer in zitten, met als gevolg dat de kans dat iemand de informatieplicht schendt ook kleiner is. 

In totaal bevat het model 800 beslisbomen voor het berekenen van de fraudescore. Het aantal combinaties van gedragingen in deze beslisbomen is zelfs nog groter: meer dan een miljard. Deze beslisbomen zijn samengesteld op basis van gedragingen en wijzigingen in gedrag die in het verleden hebben geleid tot de conclusie fraude of geen fraude. Het openbaar maken van de beslisbomen zou kunnen leiden tot diepgaande en uitgebreide inzichten in de patronen waarop werd gezocht en daardoor een goede uitvoering van de Participatiewet ondermijnen, "daarom kunnen wij de beslisbomen niet aan u verstrekken", aldus WIL. 

Wel stuurt WIL mij alle (dertien) tabellen met gegevens over mij die WIL aan Totta heeft verstrekt om de fraudescore te berekenen. Dat zijn: * basis-cliëntgegevens; * vorderingen die WIL op de cliënt heeft; * blokkades bij het uitbetalen van de uitkering; * gegevens over de uitbetaling; * vakantieperiode; * vermogen; * werkprocessen (bijvoorbeeld uitkeringsaanvragen, controles, andere regelingen); * signalen van het Inlichtingenbureau (via het programma Liaan); * participatiedoelgroep; * participatieladder (bijvoorbeeld afstand tot de arbeidsmarkt); * RPO (rechten, plichten en ontheffingen), * uitkeringshistorie en * betaalcomponenten (betalingen en terugvordering van uitkeringen). 

Volgens het Openbaar Verwerkingsregister van WIL kunnen overigens nog veel meer categorieën gegevens met Totta Data Lab gedeeld worden. [Zie Voetnoot]

Op basis van al die gegevens, beslisbomen en algoritmes krijg ik dus een fraudescore van 0,236602119. Dat is niet veel, ik kan er van uit gaan dat deze score geen aanleiding geeft tot nader onderzoek, maar op een schaal van 0 tot 1 is dat toch nog ruim 23%, bijna een kwart. 

Dus een kwart kans dat ik de boel bedrieg. 
Maar voor driekwart ben ik best te vertrouwen. 

[Voetnoot] In het Openbaar Verwerkingsregister van WIL wordt Totta genoemd, als ontvanger van de volgende data: BSN, NAW, emaildres, telefoonnummer, geboortedatum; gegevens over gezondheid, strafrecht, hinderlijk gedrag; signalen van het Inlichtingenbureau; anonieme meldingen; echtscheidingsvonnis; huurovereenkomst; bankafschriften, vermogensgegevens, hypotheekakte, internetgegevens, openbare en niet-openbare bronnen, inkomensgegevens, arbeidsgegevens, verblijfsgegevens, UWV, werkervaring, opleidingen, uitkeringen, vorderingen, polissen, maatregelen, huisvesting, leefvorm, trajectplan, participatieplaats, re-integratie, Rijksdienst voor het Wegverkeer (RDW). Bron: Verwerkingsregister WIL

Dossier Algo: go.stylo.nl/algo
voor Omroep Houten
Daar Hou Ik U Aan
Elke zaterdag 11 tot 12 uur
HoutenFM: 107.3 FM
Web: omroephouten.nl
De brief waar dit blog op gebaseerd is: 

Alle links uit dit artikel op een rij: 
Antwoord op raadsvragen VVD Amsterdam
NOS Journaal over voorspellende algoritmes bij de overheid
SyRi (Systeem Risico Indicatie) verboden door rechter
Nissewaard en Totta
FNV: Vraag je fraudescore in Nissewaard op 
Modelbrief (FNV) inzageverzoek fraudescore 
* Stichting Inlichtingenbureau, Utrecht

Meer informatie: 
Platform Bescherming Burgerrechten bewerkstelligde via de rechter een verbod op het Systeem Risico Indicatie (SyRI) van de overheid en wil vergelijkbare systemen onder de loep nemen om ze in lijn te brengen met de SyRI-uitspraak. Het platform werkt samen met de FNV om in gemeente Nissewaard openheid te krijgen over de wijze waarop deze gemeente met het bedrijf Totta Data Lab bijstandsgerechtigden doorlicht met data-analyses. 
Zie ook: Bij voorbaat verdacht in Nissewaard.


1 opmerking:

  1. 'Bij voorbaat verdacht', een programma van het Platform Bescherming Burgerrechten, dat een zaak aanspande tegen de overheid over SyRI, heeft mijn blog over WIL en Totta gelinkt op Twitter en van commentaar voorzien (met WIL als 'gemeente Lekstroom'):

    "Een kwart kans dat ik de boel bedrieg. Maar voor driekwart ben ik best te vertrouwen." In dit blog doet @ytzen verslag van zijn inzageverzoek bij gemeente Lekstroom, dat haar bijstandsgerechtigden doorlichtte met de risicoprofielen van Totta Data Lab. http://blog.stylo.nl/2021/01/innocent-bijstander.html

    Meer info dan een fraudescore van 23% krijgt hij niet: de beslisbomen die tot deze score leidden zijn geheim. Inzage zou kunnen leiden tot "diepgaande en uitgebreide inzichten in de patronen waarop werd gezocht en daardoor een goede uitvoering van de Participatiewet ondermijnen".

    Dit druist regelrecht in tegen het SyRI-vonnis, dat bepaalde dat burgers zich inhoudelijk moeten kunnen verweren tegen de wijze waarop ze worden doorgelicht met hun data. Gemeente Lekstroom is al gestopt met Totta, maar gemeente Nissewaard gaat gewoon door met deze praktijken.

    Daarbij wordt ze niet teruggefloten door het Ministerie van Sociale Zaken, dat na het SyRI-vonnis aangaf zich neer te leggen bij de uitspraak en SyRI stopzette. Het ziet ernaar uit dat de rechter er opnieuw aan te pas moet komen om private SyRI's bij gemeenten ook stop te zetten.

    Bron: https://twitter.com/ubentverdacht/status/1346454933349019648

    BeantwoordenVerwijderen