Siker

2020.08.30.

Kutatócsapatunk óriási lehetőséget kapott – Az “OTKA” kutatási pályázat 2020. évi nyertesei között vagyunk! 2020-2023 közötti időszakra nyertünk támogatást, A politikai nyilvánosság rétegei Magyarországon (2001-2020) – a hivatalos, a médiabeli és a laikus online nyilvánosság szociológiai vizsgálata automatizált szövegelemzés és kritikai diskurzuselemzés használatával című kutatásra. Kutatásvezető: Németh Renáta.

A pályázat résztvevői: Barna Ildikó, Sik Domonkos, Rakovics Márton, Katona Eszter, Knap Árpád (RC2S2, ELTE TáTK) és Csigó Péter (BME).

A pályázat összefoglalója

Kutatásunk az NLP (Natural Language Processing: természetes nyelvfeldolgozás) innovatív, szociológiailag releváns módon való alkalmazásával a politikai nyilvánosságban detektálható nyelvhasználati változásokra koncentrál; ezeket a változásokat digitális szövegkorpuszon vizsgálja, a nyelvet mint az ideológia és hatalom eszközét tekintve, a kritikai diskurzuselemzés elméleti keretei között.

Két kiemelt, a társadalom, illetve a szociológia számára fontos tétje van a kutatásnak: (1) A politikai nyilvánosság különböző szintjeinek működése, e szintek közti interakció, ennek dinamikája, a nyelvben megmutatkozó ideológiai polarizáció, illetve olyan diskurzusok azonosítása, ahol ez nem érvényesül. (2) Az NLP módszertan szerves integrálása az empirikus szociológiába.

A kutatás mindkét eleme nemzetközileg is releváns, hiszen a vizsgált jelenség nem magyar sajátosság, máshol is tapasztalható a nyelvi polarizáció és a nyelvhasználati diffúziós folyamatok Az NLP módszertan szerves integrálása az empirikus szociológiába szintén kurrens, mert lehetőséget ad a nagy mennyiségben rendelkezésre álló digitális szövegek újfajta elemzésére úgy, hogy az eredmények interpretációjához felhasználja a szociológiai tudást.

Az adatgyűjtés és adatelemzés módszertani innovációit, a fejlesztett eszközöket nyilvánosságra hozzuk digitális repozitóriumokon, szakcikkeken és konferenciaelőadásokon, ezzel támogatva az NLP nemzetközi és hazai társadalomtudományi felhasználóit. A kutatócsoport szenior tagjai doktori témavezetőként fiatal kutatóknak, valamint szakmai gyakorlat és TDK/szakdolgozati témakiírás formájában egyetemi hallgatóknak lehetőséget teremtenek a projekthez való kapcsolódáshoz.

A kutatás jelentősége

A digitális forradalom az önkifejezés forradalma is. Míg korábban a szöveges dokumentumok főként az elit narratívái voltak, az internet megnyilvánulási lehetőséget ad gyakorlatilag bárki számára. Kutatásunk relevanciáját elsősorban az adja, hogy ennek a folyamatosan képződő szövegfolyamnak az automatizált feldolgozásával alátámaszthatóvá és megérthetővé teszi a politikai nyilvánosságnak azokat a sajátosságait, melyek a megfigyelők számára csak lokálisan észlelhetők. Kutatásunk tudományos és társadalmi tétje is nagy.

Tudományos szempontból kutatásunk a társadalomkutatás számára nyit perspektívát a survey önbevalláson alapuló információi helyett a megfigyeléses adatok kvantitatív kutatásba emelésével, a kvalitatív (diskurzuselemzés) és kvantitatív megközelítés kombinálásával, az informatikai-nyelvtechnológiai területről jövő módszerek innovatív társadalomkutatási felhasználásával. Mindez nemzetközi szinten is újdonságnak számít. A digitális kommunikáció különböző szintjeit lefedő nagyméretű szövegkorpusz NLP eszközökkel való elemzése tudomásunk szerint hazai közegben úttörő vállalkozás. Míg az erős ideológiai polarizációra vannak bizonyítékok (pl. Vegetti, 2018), és vizsgálták a politikai nyilvánosság networkösödésében megnyilvánuló polarizációt is (Bene és Szabó 2019), a nyelvi polarizáció itthon nem kutatott, és nemzetközi szinten is csak néhány előzményt találtunk, tervezett kutatásunknál jóval szerényebb alkalmazási területtel (lásd pl. Demszky és társai 2019, Twitter-adatokon).

Kutatásunk társadalmi tétje is jelentős: a nyilvánosság a modern képviseleti demokráciák alapköve, ahol fontos szerepet játszik a potenciális torzulások, krízisek megelőzésében.

A pályázat erőssége végül, hogy egy létező és rövid története ellenére sok sikert felmutatott kutatócsoport áll mögötte, nemzetközi publikációkkal, több doktori témával, tudatosan épített hazai és nemzetközi network-kel. A kutatócsoport célja az innovatív módszereket alkalmazó, a szociológiai tudományterületi tudást felhasználó kutatásokon kívül az is, hogy a hazai (és nemzetközi) szociológia számára új és perspektivikus megközelítés, az automatizált szöveganalitika társadalomkutatási intézményesülését elősegítse.

Publikáció

2020.08.25.

Kutatócsoportunk tagjainak (Németh Renáta, Sik Domonkos, Máté Fanni) írása az International Journal of Qualitative Methods (Q1, impakt faktor 3,6) lapjain. Amikor szociológusok alkalmaznak gépi tanulást: a “big data” szövegelemzés hermeneutikai korlátai nem-triviális fogalmak tanítása esetén. Örömmel olvastuk a lektori véleményekben miszerint “The article is the one of the fundamental researches in this area.” és “I look forward to seeing future efforts as you proceed with this research.” Az utóbbi kívánság, reméljük, teljesülni fog, online depresszió fórumok témában három nemzetközi publikációnk is bírálat alatt van.

A publikáció a következő linken olvasható: https://journals.sagepub.com/doi/full/10.1177/1609406920949338

További információk a projektről ezen az oldalon találhatók.

Online antiszemitizmussal foglalkozó kutatócsoportunk új, a koronavírussal összefüggő online antiszemitizmusról szóló projektbe kezdett

2020.07.27.

A zsidókat a történelem során sokszor vádolták azzal, hogy szándékosan betegségeket terjesztenek a nem zsidók között. A koronavírus járvány kitörésével egyidőben újra megjelentek a zsidókat a vírussal összekötő összeesküvés-elméletek. Ezeknek a konteóknak a terjesztésében az internetnek kiemelkedő jelentősége van. Kutatásunkban egy nagyméretű, magyar nyelvű online cikkekből és kommentekből álló szövegkorpuszt vizsgálunk arra a kutatási kérdésre keresve a választ, hogy megjelennek-e a fent említett diskurzusok a magyar adatokban, és ha igen, akkor mi ezek tartalma. Korpuszunk 2019. december 1. és 2020. június 10. közötti időszakban magyar nyelven írt cikkeket, hozzászólásokat, kommenteket tartalmaz, amelyekben egyszerre fordul elő a zsidó, Izrael vagy cionista szó és a koronavírus vagy ennek valamilyen más megnevezése. A koronavírussal összefüggő antiszemita diskurzus látens tematikus struktúrájának feltárására elsősorban topikmodelleket használunk. A kutatásban gyakornokként vesz részt a ELTE Társadalomtudományi Karának tizenöt, szociológia alapszakos hallgatója.

Siker

2020.07.21.

Örömmel jelentjük, hogy kutatócsoportunk tagjainak két szakdolgozója is elnyerte az „Év szakdolgozata” címet. Farkas Anna a szociológia BA-n (témavezető: Németh Renáta), Buda Jakab a Survey Statisztika és Adatanalitika MSc-n (témavezető: Rakovics Márton) írta a legjobb szakdolgozatot. Gratulálunk! A dolgozatok itt olvashatók, más CSS-témában íródott, kutatócsoportunk tagjai által vezetett dolgozattal együtt.

Vállalati együttműködés

2020.06.30.

Az Inspira Group kutatócég a “data for social good” elv mentén térítésmentesen tette lehetővé, hogy Farkas Anna szociológia BA-s hallgatónk szakdolgozatához online omnibusz kutatásukhoz kapcsolhasson kérdéseket. A Németh Renáta témavezetésével készült szakdolgozat az algoritmikus torzításnak nevezett jelenséget egy Google Fordítóról készült esettanulmányon keresztül mutatja be (a dolgozat ezen a linken érhető el), a nemi torzítást vizsgálva foglalkozások magyar-angol fordításánál („ő egy orvos” -> „he” vagy „she”?). A kutatás egyik célja a nemi torzítás mértékének (a szakirodalomban sokszor tévesen megközelített) definiálása volt – a fordításokat a foglalkozások valós nemi arányához viszonyította, illetve ahhoz, hogy a mai magyar társadalom hogyan gondolkodik a foglalkozásokról, azokat inkább nőiesnek vagy inkább férfiasnak tartja. Az Inspira ez utóbbiban segítette a kutatást: online omnibusz kutatásuk keretében, reprezentatív lakossági mintát kérdeztek a foglalkozások megítéléséről a szakdolgozó által megadott kérdések használatával. A dolgozat konklúziója szerint a Google Fordító fordításai inkább tükrözik a társadalom foglalkozásokról alkotott véleményét, mint a foglalkozások valós nemi arányát.

Szakmai megjelenés

2020.03.18.

Megjelent a Statisztikai Szemlében Brecsok Anna tavaly, a Survey Statisztika és Adatanalitika MSc-n készült szakdolgozata, amiben survey experimentet végzett egy olyan probléma vizsgálatára, amire a munkahelyén bukkant. A témavezető (és társszerző) kutatócsoportunk társ-vezetője, Németh Renáta volt.

A szociológia egy sikeres évszázad előtt? – konferencia NLP szekcióval

2020.03.10.

Megnyílt a jelentkezési lehetőség A szociológia egy sikeres évszázad előtt? című konferenciára, amely 2020. június 11-12 között kerül megrendezésre az MTA Társadalomtudomány Kutatóközpontjában. A konferencián az NLP szociológiai alkalmazásai külön szekcióval szerepelnek, kutatócsoportunk két társvezetője, Barna Ildikó és Németh Renáta, valamint Ságvári Bence, az MTA CSS-Recens kutatócsoportjának vezetője javaslatára és szekcióvezetésével. A konferenciára március 31-ig lehet jelentkezni.

Frissítés: a koronavírus kapcsán kialakult helyzet miatt bizonytalanná vált, hogy megtartásra kerül-e a konferencia júniusban. Ettől függetlenül azonban bátorítunk mindenkit, hogy adjon be absztraktot a megadott április 15-i határidőig (meghosszabbított határidő), mert a konferenciát meg fogjuk tartani, legrosszabb esetben egy későbbi időpontban.

Barna Ildikó előadása a prágai Károly Egyetemen

2020.02.20.
Barna Ildikó, kutatócsoportunk társvezetője előadást tartott a jelenkori magyarországi antiszemitizmusról a prágai Károly Egyetem Alkalmazott Nyelvészeti Intézetében. Az előadás alapját a Knap Árpáddal közösen végzett Online Antiszemitizmus kutatás jelentette. Előadásában a kutatás eddigi eredményeinek ismertetésén túl kitért arra is, hogy a természetesnyelv-feldolgozás outputjának interpretálásához miért nélkülözhetetlen a szociológiai és a szakterületi tudás.
Az előadásról további információ található az egyetem honlapján. A prezentációról készült videófelvétel ezen a linken tekinthető meg.

Kutatás és készségfejlesztés TDK-zó hallgatók számára, kutatócsoportunk részvételével

2020.02.19.

Kutatócsoportunk is képviselteti magát abban az ELTE TáTK TDK-műhelye által elnyert NTP-HHTDK pályázatban, amely a hazai Tudományos Diákköri műhelyek és rendezvényeik támogatására jött létre. Ennek keretében a tavaszi félévben Python-alapú szöveganalitikai tanfolyamot hirdetünk a kar hallgatói számára, amelyet követően lehetőség lesz szakmai gyakorlati munkát végezni kutatócsoportunkban.

NLP-s szekció az ISA RC33 ciprusi konferenciáján

2020.01.29.

Kutatócsoportunk két vezetője, Barna Ildikó és Németh Renáta sikeresen kezdeményezett egy szekciót “Natural Language Processing: a New Tool in the Methodological Tool-Box of Sociology” címmel az International Sociological Association RC33 (Logic and Methodology in Sociology) ciprusi konferenciáján, amelyet 2020. szeptember 8. és 11. között tartanak. A szekcióba január 30-áig várjuk az absztraktokat, amelyeket a konferencia weboldalán lehet benyújtani.

Kutatócsoportunk kapta az Ariosz Kft. támogatását

2020.01.03.

A 2019-es évben a kutatócsoportunk hallgatói programja kapta az Ariosz Kft. támogatását, amellyel a kvantitatív társadalomkutatás területén végbemenő átalakuláshoz kívánnak hozzájárulni.

Teltház és nagy siker workshopunkon

2019.10.11.

Teltházzal és nagy sikerrel zárult a társadalom kutatásának új útjai című workshop, melyet kutatócsoportunk szervezett

Az első szekció, amelyet Simon Sára vezetett, az automatizált szöveganalitikai megoldások társadalomtudományi alkalmazásáról szólt. Az első előadásban Németh Renáta az új módszerek társadalomtudományi pozíciójáról beszélt, előadásába beágyazva a kutatócsoport célját is. Másodikként Barna Ildikó és Knap Árpád antiszemita cikkekben és kommentekben detektálta a sokszor survey módszerrel nem mérhető, különböző típusú zsidóellenes narratívákat. Kmetty Zoltán és Koltai Júlia harmadikként a szóbeágyazási modellekre fókuszáltak; a módszertan bemutatása mellett konkrét példákkal demonstrálták az elemzés potenciális lehetőségeit a társadalomtudósok számára. Sik Domonkos és Máté Fanni a depresszió keretezéseinek online fórumokon való vizsgálatával kapcsolatos eredményeikről beszéltek, külön kitérve a humán annotáció előnyeire és nehézségeire. Katona Eszter szintén Máté Fannival a szekció utolsó előadásában ugyanezen kutatás kapcsán a felügyelt tanítási modellek módszertanára a helyezte a hangsúlyt.

A második szekcióban Palkó Gábor egy általuk épített, HECEdata nevű szemantikus prozopográfiai (kollektív életrajzi) adathálózat elemzéséről beszélt, amely akár a WikiDATA adatelemeivel közösen is vizsgálható. Ezután Indig Balázs a webaratás tudományos szükségessége mellett érvelt, majd lépésenként mutatta be magát a folyamatot, kifejezetten bölcsész- és társadalomtudományi célú felhasználások esetén.

A harmadik szekciót Szálkai Kinga vezette és Fokasz Nikosz előadása nyitotta meg. Prezentációjában a professzor a magyar és görög auto- és heterosztereotípiákról, továbbá az identitásokból képzett és a sajtóban megjelent cikkek alapján készített hálózatokról beszélt. A szekció második előadását Susánszky Pál és Gerő Márton tartották a magyarországi tüntetésekkel kapcsolatos, általuk kiegészített rendőrségi adatbázis elemzéséről. A szekció és a workshop legutolsó előadását Takács Erzsébet és Takács Flóra tartotta. Ők az előző prezentációt nagyobb keretbe helyezve a hazai mozgalomkutatás hagyományairól és problémáiról, továbbá a tüntetési eszközökről beszéltek.

A workshopon elhangzott előadások diái az alábbiakban találhatók:

Nemzetközi együttműködés az európai emlékezetpolitika témájában

2019.10.02.

Az ELTE TáTK Empirikus Tanulmányok Intézetének RC2S2 kutatócsoportja részt vesz az “European Memory Politics – Populism, Nationalism and the Challenges to a European Memory Culture (EuMePo)” [Európai emlékezetpolitika – populizmus, nacionalizmus és az európai emlékezeti kultúra kihívásai] című nemzetközi együttműködésben a kanadai University of Victoria (UVic) vezetésével. A Jean Monnet Network Grant keretében folyó pályázat további partnerei az Université de Strasbourg és az Adam Mickiewicz University (Poznań).

(tovább…)

A társadalom kutatásának új útjai workshop

2019.09.12.

Workshopunkon az ELTE Társadalomtudományi Karán, a Felsőoktatási Intézményi Kiválósági Program (FIKP) által finanszírozott egy éve folyó munka eredményeit mutatjuk be. A Research Center for Computational Social Science (RC2S2) kutatócsoport által szervezett eseményen bemutatkoznak az FIKP által finanszírozott, az ELTE Társadalomtudományi Karán működő kutatócsoportok, valamint az ELTE Bölcsészettudományi Kara Digital Humanities kutatóközpontjának képviselői, akikkel kutatócsoportunk a program keretében is együttműködik.

A workshop részletes programja az alábbi programfüzetben olvasható. 

További információk

Időpont:  2019. október 11. péntek, 10:00-15:00

Helyszín: ELTE Társadalomtudományi Kar, Pázmány Péter sétány 1/a, Kari Tanácsterem (0.100C)

Facebook-esemény: [link]

A workshopra minden érdeklődőt szeretettel várunk, azonban a részvétel regisztrációhoz kötött. Regisztrálni a következő linken lehet: [link]

 

Barna Ildikó és Németh Renáta

a szervezőbizottság vezetői

Szakmai gyakorlat

2019.09.05.

Szeptembertől három Survey statisztika és adatanalitika mesterszakos hallgató segíti kutatócsoportunk munkáját. Herczeg Simon, Prónai Kristóf és Szabó Zsolt az ELTE BTK Digital Humanities központjában, a Research Center for Computational Social Sciences és a Digital Humanities kutatóközpont közötti együttműködés részeként Palkó Gábor, a DH kutatóközpont társvezetője, és Indig Balázs, számítógépes nyelvész, a DH kutatója szakmai irányítása alatt végez szöveganalitikával kapcsolatos tevékenységet. Feladataik elsődlegesen a Webaratás projekthez kapcsolódnak. A munka kapcsán érdekes és piacképes programozási tudást sajátítanak el a résztvevők. Jó munkát kívánunk nekik!

Előadás

2019.08.21.

2019 augusztusában az online antiszemitizmus kutatócsoport képviseletében Barna Ildikó és Knap Árpád tartott előadást a European Sociological Association (ESA) konferenciáján Manchesterben. Előadásukban a jelenkori online antiszemitizmust vizsgálták a szélsőjobboldali Kuruc.info cikkeinek és kommentjeinek elemzésével LDA topikmodell segítségével. Korábban megjelent publikációjukban a cikkek vizsgálatával foglalkoztak, most ezt egészítették ki a kommentek elemzésével és a kettő összehasonlításával. A prezentáció ide kattintva elérhető.

Megújult képzési program

2019.07.01.

A Survey Statisztika és Adatanalitika MSc nevet viseli a 2019/2020-as tanévtől kezdődően a Survey Statisztika MSc program. Az elmúlt években a képzés tartalma jelentősen megváltozott, mind az oktatott eszközöket, mind a célzott munkaerő-piaci területeket tekintve. Hálózatelemzést, szöveganalitikát, adatbányászati módszereket, többféle statisztikai programcsomagot és programnyelvet tanulnak a hallgatók a társadalomkutatás tudományos, közigazgatási és üzleti alkalmazásaiban egyaránt.

Vállalati együttműködés

2019.07.01.

Kutatócsoportunk adatszolgáltatási megállapodást kötött a SentiOne social listening céggel. A cég három évre visszamenően keresi, figyeli, rögzíti és elemzi az online közzétett publikus szöveges tartalmakat ezek kutatócsoportunk több projektjének is korpuszát adják.  

Vállalati együttműködés

2019.07.01.

A Clementine Magyarország-gal létrejött együttműködésünk keretében a 2018/19-es tanévtől kezdődően a cég szöveganalitikai képzéseket tart és szöveganalitikai szakdolgozati témákat ír ki hallgatóinknak a robotokkal való beszélgetés jellegzetességeitől a weben megfigyelhető átalakuló médiafogyasztási szokásokon át a politikai pártok Facebook-aktivitásáig.

Siker

2019.07.01.

Kmetty Zoltán elnyerte az NKFI Fiatal Kutatói pályázatát. A 36 hónapra kapott kutatási támogatás keretében a projektben egy kísérleti Facebook kutatás valósul meg. A projekt elsősorban módszertani fókuszú, és a Facebook kutatási felhasználhatóságát emeli a fókuszba,

A kutatás honlapja: https://fbpilot.tatk.elte.hu

Siker

2019.06.15.

2019 tavaszán a tavalyinál is többen – 80 fő, ebből  50 fő első helyes – jelentkezett a Survey Statisztika és Adatanalitika MSc mesterszakra; ezzel a szak az ELTE 163 mesterszakja között a 10. helyen van az első helyen megjelölt nappali rendszerű mesterképzésre jelentkezők számát tekintve.

Publikáció

2019.06.15.

Megjelent Barna Ildikó és Knap Árpád közös publikációja, amely a jelenkori magyar online antiszemitizmust vizsgálja a Kuruc.info weboldalon található cikkeken keresztül. A publikáció ingyenesen hozzáférhető a Theo-Web című folyóirat weboldalán, ide kattintva.

Előadás

2019.05.14.

Katona Eszter ‘Natural Language Processing in Social Sciences’ címmel tartott előadást 2019. május 10-én Bázelben, a Joint Annual Conference of the GPSA Methods of Political Science Section and the SPSA Empirical Methodology Working Group (https://www.methodology-dvpw-svpw.com/) konferencián. Előadásában a Németh Renátával és Kmetty Zoltánnal közösen írt, megjelenés alatt álló cikk eredményeit ismertette.

Előadás

2019.05.09.

Kmetty Zoltán és Koltai Júlia ‘Understanding Cultural Choices with NLP’ címmel tartottak előadást 2019. május 9-én a Budapest Data Science Meetup-on. Az előadás a természetesnyelv feldolgozás (natural language processing, NLP) és azon belül is a neurális hálókon alapuló szóbeágyazási modellek szerepét taglalta az emberi viselkedés és kultúra megismerésében. Az előadás absztraktja itt érhető el:

https://www.meetup.com/budapest_data_science/events/260865653/

Publikáció

2019.05.01.

Megjelent Koltai Júlia társszerzőségével a ‘Collapse of an online social network: Burning social capital to create it?’ című tanulmánya a D1-es minősítésű, 2.53-as impact factorú Social Networks folyóiratban. A tanulmány az iWIW közösségi oldal összeomlását vizsgálja kapcsolathálózati megközelítésből. A cikk ‘open access’, ingyenesen itt olvasható:

https://www.sciencedirect.com/science/article/pii/S0378873317301399

Konferencia-szervezés

2019.03.05.

Koltai Júlia volt az egyik szervezője a 2019. március 4-én, a Central European University-n rendezett ‘Women in Data Science Budapest’ konferenciának, mely az azonos nevű, Stanford University-n rendezett konferencia társeseménye volt. A konferencia több mint 350 résztvevőt vonzott. Az esemény és a hozzá kapcsolódó anyagok itt érhetők el:

https://www.facebook.com/events/2134883203508900/

A konferenciáról készült videó itt található:

Előadás

2019.02.23.

Barna Ildikó 2019. február 23-án előadást tartott az “Antisemitism, Anti-Zionism, Israel, and the Holocaust” című workshopon Salzburgban. Az előadás címe: “Overt and Subtle Antisemitim in Hungary” volt. Az előadásban beszélt az antiszemitizmus mérésének módszereiről és kihívásairól. A magyarországi antiszemitizmusról szóló nagymintás adatfelvételek eredményeinek bemutatásán túl beszélt a kutatás új lehetőségeiről; ezen belül is kiemelten foglalkozott a Natural Language Processing (NLP) nyújtotta lehetőségekről, valamint az online gyűlöletbeszéd munkacsoport kutatásáról.