Rakovics Zsófia

Tanársegéd
Rakovics Zsófia

Rakovics Zsófia

Tanársegéd

Rakovics Zsófia, statisztikus és szociológus. Egyetemi tanulmányai alatt többek között a prekaritás kérdéskörével, a globalizáció társadalomra és a munka világára gyakorolt hatásával, a nemi egyenlőtlenség kérdésével, illetve emlékezetkutatással, Holokauszt túlélők elbeszéléseinek kvalitatív elemzésével foglalkozott. Módszertani érdeklődése szerteágazó, kvalitatív és kvantitatív módszereket egyaránt érint. Mesterképzéses tanulmányai befejezése után adattudósként dolgozott egy nemzetközi cégnél, amely képfeldolgozó és gépi tanuláson alapuló módszerekkel vizsgálta az emberek érzelmi reakcióit. Érdeklődése az utóbbi időben ismét az emlékezetkutatás, illetve a populizmus és a politikai témájú közbeszéd szövegbányászati eszközökkel történő elemzése felé fordult, a kutatócsoport munkájához ezen kutatási projektek mentén kapcsolódik. Doktori kutatásának középpontjában a nyelvi polarizáció vizsgálata áll, a politikai témájú közbeszéd elemzését végzi mély tanuláson alapuló nyelvmodellekkel.

 

Doktori kutatás A politikai nyilvánosság rétegei Magyarországon (2001-2020) c. (NKFIH-K-134428) kutatáshoz kapcsolódva

A nyelvi polarizáció szociológiai vizsgálata

Doktorandusz hallgató: Rakovics Zsófia

Konzulensek: Dr. Németh Renáta és Dr. Sik Domonkos

Összefoglaló

A doktori kutatás az online politikai közbeszédben megfigyelhető nyelvi változást és polarizációs tendenciákat (Gentzkow et al. 2016; Prior 2013) vizsgálja empirikusan, mélytanuláson alapuló nyelvmodellekkel (Vaswani et al. 2017; Devlin et al. 2018).

A mélytanuláson alapuló nyelvmodellek olyan sok réteggel és paraméterrel rendelkező mesterséges neurális hálózatok, amelyek képesek a természetes nyelv szintaktikai és szemantikai jellemzőinek megtanulásával értelmes szöveg generálására (Vaswani et al. 2017; Devlin et al. 2018); a bementeként megadott szöveghez – a belső, absztrakt reprezentáció szerint – leginkább illeszkedő szöveget hozzák létre (Brown et al. 2020; Mikolov et al. 2013; Radford et al. 2019).

Az információ-terjedés mintázatainak szöveges lenyomataiból rekonstruálható az online politikai tér diszkurzív struktúrája, azonosíthatók benne a hálózati centrumok és perifériák (Bryden et al. 2013), illetve az információterjedés „fertőzési mintázatai” (Alshaabi et al. 2021; Hamilton és Hamilton 2010). Az online politikai kommunikációban empirikusan letapogatott nyelvi változás és nyelvi polarizáció, illetve azok jellegzetességeinek és dinamikájának részletes leírásával mélyebb ismereteket gyűjthetünk a közbeszéd működési módjairól, ezáltal azok társadalomra gyakorolt hatásáról.

A doktori kutatás célja, hogy a magyar adatokon tanított modelleket elérhető tegye egy könnyen kezelhető grafikus felhasználói felülettel együtt, melyen keresztül mély technikai ismeretek nélkül végezhető új feladatok definiálása (például szövegek osztályozása, kivonatolása) és a válaszok kinyerése. A kutatás során kidolgozott módszertan, a nyelvmodellek szélesebb körű szociológiai alkalmazását segíthet megalapozni.

Hivatkozások

Alshaabi, T., Dewhurst, D. R., Minot, J. R., Arnold, M. V., Adams, J. L., Danforth, C. M., & Dodds, P. S. (2021). The growing amplification of social media: measuring temporal and social contagion dynamics for over 150 languages on Twitter for 2009–2020. EPJ data science, 10(1), 1-28.

Brown, T. B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., … & Amodei, D. (2020). Language models are few-shot learners. arXiv preprint arXiv:2005.14165.

Bryden, J., Funk, S., & Jansen, V. A. (2013). Word usage mirrors community structure in the online social network Twitter. EPJ Data Science, 2(1), 1-9.

Devlin, J., Chang, M. W., Lee, K., & Toutanova, K. (2018). Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805.

Gentzkow, M., Shapiro, J., & Taddy, M. (2016). Measuring polarization in high-dimensional data: Method and application to congressional speech (No. id: 11114).

Hamilton, J. D., & Hamilton, L. C. (2010 [1981]). Models of social contagion. Journal of Mathematical Sociology, 8(1), 133-160.

Mikolov, T., Yih, W. T., & Zweig, G. (2013). Linguistic regularities in continuous space word representations. In Proceedings of the 2013 conference of the North American chapter of the association for computational linguistics: Human language technologies (pp. 746-751).

Prior, M. (2013). Media and political polarization. Annual Review of Political Science, 16, 101-127.

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language models are unsupervised multitask learners. OpenAI blog, 1(8), 9.

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., … & Polosukhin, I. (2017). Attention is all you need. arXiv preprint arXiv:1706.03762.