Platform Participatie

Veelgestelde vragen data-analyse zienswijzen

Hieronder vindt u een aantal veelgestelde vragen over de data-analyse van zienswijzen. Onder andere waarom het ministerie van Infrastructuur en Waterstaat een data-analysetool en algoritmes gebruikt voor de analyse van zienswijzen en welke databronnen gebruikt worden.

Tijdens de uniforme, openbare voorbereidingsprocedure legt de overheid een voornemen, concept of ontwerp van een plan of besluit voor aan het publiek. Burgers, bedrijven en organisaties sturen hun mening en gedachten over het voornemen of concept van het plan of besluit in via een zienswijze. Door zienswijzen te vragen, komen eventuele problemen en vragen in het voornemen of concept aan het licht. Ook brengen burgers, bedrijven en organisaties met een zienswijze hun belangen over. Als alle relevante feiten en de af te wegen belangen verzameld zijn, neemt de minister mede op basis van alle ingediende zienswijzen een besluit.

Het analyseren van zienswijzen is een arbeidsintensief proces. Op enkele projecten komen wel duizenden zienswijzen binnen in enkele weken tijd. Participanten dienen een zienswijze in om informatie, een standpunt, belang of mening over te brengen. Als alle relevante feiten en de af te wegen belangen zijn verzameld, neemt de minister mede op basis van alle ingediende zienswijzen een besluit.

Het is dan ook van belang dat de inhoud van de zienswijzen zorgvuldig geanalyseerd wordt door ambtenaren. Door, naast de handmatige analyse, ook data-analysetechnieken in te zetten, wordt deze zorgvuldige analyse gewaarborgd. Bovendien zijn met behulp van de data-analysetool analyses mogelijk die met de handmatige methode niet eenvoudig gerealiseerd kunnen worden. Dit komt doordat computers meer rekenkracht en mogelijkheden hebben om data te analyseren en te visualiseren.

De data-analysetool voor zienswijzen is een softwareoplossing om projectteams te ondersteunen bij de analyse van zienswijzen die binnenkomen op ontwerpplannen en -besluiten van het ministerie van IenW. De algoritmes geven weer over welke onderwerpen de zienswijzen gaan en in welke mate zienswijzen inhoudelijk op elkaar lijken. Het zijn algoritmes voor tekstanalyse. De data-analysetool ondersteunt het werk van ambtenaren, maar geeft geen adviezen en neemt geen besluiten.

De data-analysetool voor zienswijzen wordt ter ondersteuning gebruikt bij de analyse van zienswijzen en niet ter vervanging van de handmatige analyse van zienswijzen. Er is dus altijd menselijke tussenkomst en betrokkenheid. Een voorbeeld: het algoritme laat zien dat een zienswijze over thema X gaat. Er bestaat een kans dat het algoritme dit mis heeft en dat een zienswijze eigenlijk over thema Y gaat. Doordat alle zienswijzen handmatig beoordeeld en beantwoord worden, kan een medewerker eventuele fouten nog corrigeren.

Op de meeste plannen en besluiten van het ministerie van IenW is de uniforme, openbare voorbereidingsprocedure uit de Algemene wet bestuursrecht van toepassing.

Iedereen kan een zienswijze indienen om het te laten meewegen in de beleid- en besluitvorming. Een indiener verwacht dat zijn of haar zienswijze geanalyseerd wordt en meegewogen wordt in de beleid- en besluitvorming. Alleen voor dat doel gebruiken wij dit systeem. Er zijn geen andere gevolgen voor burgers en bedrijven.

Zienswijzen die via www.platformparticipatie.nl binnenkomen op de ontwerpplannen en -besluiten van het ministerie van IenW. Er wordt geen koppeling gemaakt met andere gegevensbronnen.

Er worden verschillende data-analysetechnieken gebruikt om zienswijzen te analyseren. Allereerst wordt een aantal technieken ingezet om data-analyse mogelijk te maken. Met de techniek Optical Character Recognition (OCR) worden zienswijzen omgezet naar voor de computer leesbare tekst. Computers kunnen alleen goed rekenen met getallen. Het proces om woorden om te zetten naar getallen wordt vectorisatie genoemd. Er worden drie verschillende algoritmes ingezet na de voorbewerking van de data:

  • Supervised algoritme

Met dit algoritme worden documenten op vooraf vastgestelde thema’s gesorteerd. Data scientists spreken over labels. Een zienswijze krijgt een label of meerdere labels toegekend, waardoor medewerkers hier sneller mee verder kunnen. Alle zienswijzen over geluid kunnen zo doorgestuurd worden naar de inhoudelijke deskundige voor geluid.

  • Unsupervised algoritme

De unsupervised algoritme halen onderwerpen en thema’s uit de tekst op basis van veel voorkomende woorden. Ook brengt dit algoritme sleutelwoorden (keywords) in kaart. Deze sleutelwoorden kunnen door inhoudelijke deskundigen verder geanalyseerd worden.

  • Mate van vergelijkbaarheid

Soms dienen participanten precies dezelfde zienswijze in. Door de vectoren van zienswijzen te bekijken, worden zienswijzen met de techniek cosine similarity onderverdeeld in de volgende drie categorieën: hetzelfde, vergelijkbaar of uniek.

Het supervised algoritme is getraind met gelabelde data. De zienswijzen (data) zijn geannoteerd door studenten en inhoudelijk deskundige ambtenaren. In 2022 vindt een nieuwe annotatieronde plaats en wordt het algoritme daarmee opnieuw getraind. Voor de algoritmes geldt dat deze periodiek voorzien worden van een update met nieuwe geannoteerde data. Daarbij worden nieuwe zienswijzen toegevoegd aan het bestaande model en wordt het bestaande model getraind op de nieuwe data en bijbehorende labels. Ook vindt monitoring plaats op de zorgvuldigheid en nauwkeurigheid van de taalmodellen.

Het supervised algoritme is goed uitlegbaar. Dat wil zeggen, dat op individueel niveau uitgelegd kan worden waarom het algoritme tot een bepaalde uitkomst komt.  

Van het unsupervised algoritme, die in de applicatie gebruikt wordt om thema’s en belangrijke woorden in zienswijzen te herkennen, zijn de belangrijkste factoren duidelijk op basis waarvan het algoritme tot een bepaalde uitkomst komt. Ook is duidelijk welke wijzigingen in de input doorgevoerd moeten worden om tot een andere uitkomst te komen.

Voor de gehele zienswijzenprocedure is een privacy impact assessment (PIA) opgesteld. Deze is opgenomen in het register van verwerkingen bij IenW. Ook staat een privacyverklaring op de website www.platformparticipatie.nl. Er zijn verschillende maatregelen genomen om de privacy van personen in de data-analyse te beschermen. Zo wordt slechts een deel van de data in de zienswijzen gebruikt in de data-analysetool. Persoonsgegevens (zoals voorletters, tussenvoegsels, achternamen, straatnummers en huisnummers) worden niet naar de data-analysetool geüpload, met als enige uitzondering de postcodes, woonplaats en de tekst van de zienswijze. Hier leest u meer over hoe u uw privacy kunt beschermen bij het indienen van een zienswijze.

De volgende maatregelen zijn genomen om discriminatie tegen te gaan:

  • Het systeem analyseert de inhoud van zienswijzen.
  • Er wordt niet geanalyseerd op het niveau van individuele persoonsgegevens.
  • Er worden geen profielen opgesteld en geen groepen gedefinieerd.
  • Ook wordt geen koppeling gemaakt met andere gegevensbronnen.

Betrokkenen kunnen met het indienen van een zienswijze hun rechten en vrijheden blijven uitoefenen. De data-analyse van zienswijzen brengt hierin geen beperking met zich mee.

Het systeem heeft een laag risico. Het belangrijkste risico is dat het systeem een zienswijze aan een verkeerde categorie van zienswijzen toedeelt. Dit kan gebeuren doordat de algoritmes die thema’s in zienswijzen herkennen nog foutmarges bevatten. Om dit risico te beheersen, wordt de data-analysetool gebruikt als aanvulling op de handmatige analyse van zienswijzen. Het is geen vervanging van de handmatige analyse.  

Op het moment dat u vragen heeft over de data-analyse van zienswijzen staat een medewerker van de directie Participatie u graag te woord, via info@platformparticipatie.nl of telefonisch door te bellen naar (070) 456 96 07.

Cookie-instellingen