Érsek Boglárka – Word embedding használhatósága a társadalomkutatásban

2024 Szociológia BA Konzulens Dr. Németh Renáta

Érsek Boglárka

Dolgozatomban a szóbeágyazási modellek társadalomtudományos felhasználhatóságát járom körül. Célom annak a bemutatása, hogy a kutatók eddig milyen jellegű vizsgálatokhoz és miként alkalmazták ezt a módszert. Megközelítésemben a “no code” technikára fókuszálok, azaz azt vizsgálom, hogy egy programozni nem tudó kutató számára milyen lehetőség van a módszer használatára. Írásomban először elhelyezem a témát a társadalomtudományos kutatási módszerek között, majd leírom a módszer lényegét és a lehetséges felhasználási módokat. A korábbi kutatások ismertetésével bemutatom, hogy a módszer egyaránt alkalmas technikai és tartalmi felhasználásra, illetve a nyelvi modelleken alapuló algoritmusok kritikus vizsgálatára is. Ezen felül bemutatom a magyar nyelvű szövegek felhasználhatóságát is. Pilot kutatásomban pedig példázom, hogy a WebVectors nevű online elérhető word embedding modell segítségével miként lehet programozói tudás nélkül is használni a módszert.

Szakdolgozat megtekintése