Németh Renáta “Who knows it better? The task of detecting discrimination using human coding vs. text mining” címmel tartott előadást az EuMePo (European Memory Politics) Jean Monnet Network budapesti konferenciáján 2023. június 15-én, társszerzői Buda Jakab és Simonovits Bori voltak. Kutatásukban a magyar önkormányzatok roma és nem roma ügyfelek információkéréseire adott válaszkészségét vizsgálták, egy országos e-mailes vizsgálatra támaszkodva, amely véletlenszerű, kontrollált vizsgálati tervet alkalmazott. A válasz e-mailek párhuzamos értékeléséhez két módszert alkalmaztak párhuzamosan: hagyományos kvalitatív kódolást és gépi tanulást (ML). Az ML-modelleik a véletlen besoroláshoz képest jelentősen jobban működtek, megerősítve a roma ügyfelekkel való megkülönböztetett bánásmódot. A legfontosabb prediktorok azt mutatták, hogy a látszólag roma ügyfeleknek küldött válaszok nemcsak rövidebbek, hanem a hangnemük is kevésbé udvarias és visszafogottabb, ami alátámasztja a figyelemdiszkrimináció gondolatát. A figyelemdiszkrimináció magasabb szintje kimutatható a férfi küldővel szemben, és a kisebb településeken. Az eredmények rámutatnak, hogy a szöveges adatokban a megkülönböztetés automatizált módon, emberi kódolás nélkül is felismerhető, és hogy az ML olyan nyelvi jellemzőket is felismerhet, amelyeket az emberi kódolók nem ismerhetnek fel.
A kutatást Németh Renáta és Buda Jakab esetében a K-134428 azonosítójú, Simonovits Bori esetében az FK-12798 azonosítójú NKFIH pályázat támogatta.