Tekstanalyse om motivaties te detecteren voor het (niet) doneren van smartphone-sensordata
In dit artikel:
Onderzoeksvragen van CentERdata (LISS‑panel) en het CBS (consent survey) uit 2017–2018 zijn gebruikt om kort geformuleerde, open antwoorden van respondenten over hun (waarschijnlijke) weigering om smartphone‑sensordata te delen te analyseren en te classificeren. Open antwoorden leveren rijke motivatie-informatie, maar handmatige codering is arbeidsintensief. De auteurs ontwikkelden een motivatietaxonomie met 11 klassen gebaseerd op het LISS‑onderzoek en droegen die over naar de CBS‑enquête met een transparante NLP‑pijplijn: lichte normalisatie van tekst, rule‑based trefwoordextractie en elastic net (elastische) logistische regressie met één drempel voor multi‑labeltoewijzing. Beide vragenlijsten vroegen onder meer naar GPS, selfie, foto van buiten het huis en korte video; LISS voegde wearable‑connectie toe, CBS vroeg om een kassabonfoto. De aanpak maakt snelle, interpreteerbare schaalcodering van korte enquêtereacties mogelijk en levert concrete aanbevelingen voor dataverzamelaars: duidelijker privacy‑uitleg, minder belastende camerataken en striktere instructies bij sensormetingen. Referentie: Smeets, Bakker, Meertens (2025), Statistics Netherlands.