Alapszakos gyakornokokat keresünk automatizált érzelemdetektálással kapcsolatos projektünkbe

2023.01.11.

Az ELTE RC2S2 kutatócsoport Szociológia alapszakos gyakornokokat keres Érzelemdetektálás projektjébe. A projektben végzett munka elfogadtatható szakmai gyakorlatként.

Munkánk célja, hogy az interneten fellelhető, magyar nyelvű, online sajtóorgánumok elmúlt húsz évben született cikkeinek segítségével egy olyan modellt hozzunk létre, amely képes szövegek érzelmi töltetének automatikus detektálására. Ehhez a szövegek címkézését, úgynevezett humán annotálását kell elvégezni.

  • Az annotálás első fázisában névelemeket, tulajdon- és közneveket kell bejelölni újságcikkekben egy útmutató alapján.
  • A második fázisban a névelemek néhány mondatos környezetét, kontextusát kell értékelni, megjelölve azt, hogy milyen érzelmek találhatóak a szövegrészletben.

Jelenleg elsősorban (de nem kizárólag) a projekt második fázisára keresünk jelentkezőket.

Ha érdekel a lehetőség, itt tudod megnézni részletes gyakornoki felhívásunkat: link.

Jelentkezési határidő: 2023. január 31.

Kutatócsoportunk bemutatkozóanyaga

2022.12.14.

Ha kíváncsiak vagytok a kutatásainkra, projektjeinkre, és arra, hogy mivel foglalkozunk ez a kis füzet segíthet megismerni a kutatócsoportunk fókuszát.

Tagjaink ÚNKP-ösztöndíjat nyertek el

2022.09.02.

Friss hír, hogy három junior tagja kutatócsoportunknak elnyerte az Új Nemzeti Kiválóság Program (ÚNKP) kutatási ösztöndíját. Katona Eszter (The hidden barriers of open competition – using text mining to explore barriers to competition in public procurement, Témavezetők: Németh Renáta – Fazekas Mihály), Rakovics Zsófi (Examining the linguistic and political polarisation of parliamentary speeches, Témavezető: Sik Domonkos) és Tóth Tímea Emese (Narrative possibilities framed by political polarisation – sustainability in online media platforms, Témavezető: Németh Renáta)

Szöveg. Gép. Társadalom.

2022.07.22. Adattudomány a társadalomkutatásban Digital Lens A depresszió diszkurzív keretezése online fórumok közösségében A politikai nyilvánosság rétegei Magyarországon (2001-2020)

Társadalmi viszonyok megragadása szöveges adatok számítógépes elemzésével

2022. 09. 20.

Az utóbbi évtizedekben lezajlott adatforradalom a legkülönbözőbb területeken generált társadalomtudományilag is releváns információforrást. Erre reagálva a kvantitatív társadalomkutatás módszertana jelentősen bővült, részben az informatika, a mesterséges intelligencia-kutatás oldaláról átemelve módszereket. A digitális forradalom ugyanakkor nemcsak új adatforrásokat hozott, hanem a társadalmat is átalakította.

Szociológusként ennek a társadalmi változásnak a megértése a célunk, eszközünket tekintve pedig a számítógépes szöveganalitikai módszerek társadalomkutatási adaptálásán és tartalmi szociológiai tudás felfedezésében történő felhasználásukon dolgozunk.

Kutatócsoportunk, az ELTE – Research Center for Computational Social Science 2018-ban alakult az egyetem Társadalomtudományi Karán. Az elmúlt négy év során több hazai és nemzetközi pályázat támogatta munkánkat, a workshop célja aktuális kutatási eredményeink bemutatása.

Workshopunk további célja néhány más területeken folyó, nyelvészeti megalapozású társadalomkutatás megjelenítése, hazai képviselőjük meghívásával. Reményeink szerint ezek az előadások inspirációt jelenthetnek az informatika oldalról érkező eszközök szélesítéséhez, az interdiszciplinaritás támogatásához és érvényes tartalmi eredmények megragadásához.

Workshopunk hibrid, offline az ELTE Társadalomtudományi Karán, míg online a Microsoft Teams felületén lehetséges a részvétel.
A Workshop helyszíne: ELTE TáTK Kari Tanácsterem (1117 Budapest, Pázmány Péter sétány 1/a., 0.100 C )
Az eseményen való offline és online részvétel is regisztrációhoz kötött. Kérjük részvételi szándékát jelezze a következő űrlap kitöltésével: [link].

 

TÉMÁK I:  SZÖVEGEK SZÁMÍTÓGÉPES ELEMZÉSE

  • a depresszió online narratívái
  • történeti dokumentumelemzés: Holokauszt-túlélők tanúvallomásai
  • a politikai nyilvánosság rétegei: emlékezetpolitika, jelentésváltozások

TÉMÁK II:  INTERDISZCIPLINÁRIS INSPIRÁCIÓK

  • társadalomföldrajz
  • interkulturális nyelvészet
  • narratív pszichológia
  • politikai dokumentum-források

PROGRAM

10.00–10.10 Köszöntő

10.10–10.40 Németh Renáta (ELTE RC2S2): Nyelvi polarizáció kutatása NLP-vel: módszertani kihívások (általánosíthatóság, oksági tévkövetkeztetés)

10.40–11.10 Rakovics Zsófia (ELTE RC2S2), Rakovics Márton (ELTE RC2S2): Parlamenti felszólalások elemzése dokumentumbeágyazással

11.10–11.30 Szünet

11.30–12.00 Buda Jakab (ELTE RC2S2), Simonovits Bori (ELTE PPK), Németh Renáta (ELTE RC2S2): Hivatali diszkrimináció? – Figyelemdiszkrimináció mérése természetes nyelvfeldolgozással

12.00–12.30 Sik Domonkos (ELTE RC2S2): Laikus betegségnarratívák és e-mentális egészség közösségek – Online depressziós fórumok szöveganalitikai elemzése

12.30–13.30 Ebédszünet

13.30–14.00 Boda Zsolt (ELKH TK), Kiss László (ELKH TK), Molnár Csaba (ELKH TK): Nemzetközi komparatív adatbázisok elérhetősége a TK-ban – Bemutatkozik a TK Comparative Agendas Project-je (https://cap.tk.hu/en)

14.00–14.30 Katona Eszter (ELTE RC2S2), Fazekas Mihály (CEU): Kísérlet a Corruption Risk Index továbbfejlesztésére a természetes nyelvfeldolgozás segítségével

14.30–15.00 Pólya Tibor (ELKH TTK): Narratív pszichológia és gépi szövegfeldolgozás

15.00–15.20 Szünet

15.20–15.50 Barna Ildikó (ELTE RC2S2), Szabó Alexandra M. (ELTE RC2S2): Digital Lens: holokauszt-túlélők vallomásainak elemzése. A történettudomány és a szociológia innovatív találkozása

15.50–16.20 Balogh Péter (ELTE TTK): A földrajzi megnevezések nem ártatlanok: kritikai geopolitikai megközelítések

16.20–16.50 Knap Árpád (ELTE RC2S2), Tóth Tímea Emese (ELTE RC2S2), Barna Ildikó (ELTE RC2S2): Érzelmek megjelenése a Trianoni békeszerződéssel és a holokauszttal kapcsolatos cikkek szóbeágyazásaiban, az érzelmek automatizált detektálásának lehetséges eszközei

16.50–17.00 Zárszó

 

Szervezőbizottság

A szervezőbizottság elnöke: Barna Ildikó és Németh Renáta
A szervezőbizottság további tagjai: Katona Eszter, Knap Árpád, Tóth Tímea Emese

Támogatóink

Siker

2021.12.01.

PhD kutatónk, Knap Árpád ÚNKP kutatását a 2020/21 évi pályázati ciklus legjobbjai közé választották záró szakmai beszámolója és előadása alapján az ELTE-n. Árpád „Huszadik századi traumákkal kapcsolatos érzelmek elemzése szöveganalitikai módszerekkel” című kutatásában a huszadik század két meghatározó eseményével, a Trianoni békeszerződéssel és a holokauszttal kapcsolatos újságcikkeket dolgozott fel a természetesnyelv-feldolgozás módszereivel. Kutatásának összefoglaló videója itt tekinthető meg. A kutatás alapján két tudományos publikáció is született – egy idegen nyelvű tanulmány Barna Ildikóval, egy magyar nyelvű pedig Bartha Diánával és Barna Ildikóval közösen. A publikációk megjelenése hamarosan várható, ezekről külön hírt adunk majd honlapunkon.

International Sociological Association RC33 konferencia

2021.07.26.

2021. szeptember 7-10. között tartják meg online, a Teams-rendszeren keresztül az International Sociological Association RC33 konferenciáját.

12. szekció: Natural Language Processing: a New Tool in the Methodological Tool-Box of Sociology. (Természetes nyelvfeldolgozás: egy új eszköz a szociológia módszertani eszköztárában)

Előadók és másodszerzők a kutatócsoportunkból: Barna Ildikó, Katona Eszter, Knap Árpád, Németh Renáta, Rakovics Márton, Sik Domonkos. A szekcióvezetők: Barna Ildikó és Németh Renáta.

A konferencián történő részvétel RC33-as tagsághoz kötött (részletek itt: www.rc33.org). A konferencia egyébként díjmentes. Minden résztvevőnek e-mailt kell küldenie a részvételi igényéről Inga Gaizauskaite részére (inga.gaizauskaite@lstc.lt).

Az első Digital Lens kick-off meetingünk

2021.02.20.

Projektünkben a http://degob.hu/ adatbázisával, a holokauszt túlélőkkel felvett jegyzőkönyvekkel fogunk dolgozni. Hihetetlen, de nemrég egy padlásról került elő egy adag jegyzőkönyv… A kutatásunk során azt is szeretnénk kideríteni, hol lapulnak még ilyen kincsek. Az eddigiek elemzését pedig az automatizált, kvantitatív és kvalitatív szövegelemzés módszereivel végezzük majd.

Ösztöndíjat nyertünk el – Digital Lens

2021.01.08.

Barna Ildikó projektvezetésével a “Revisiting Early Testimonies of Hungarian Jewish Holocaust Survivors through a Digital Lens” elnevezésű projektünkre a következő három évre kutatási ösztöndíjat nyertünk el. Az interdiszciplináris projektben természetesnyelv-feldolgozás használatával fogjuk elemezni magyar zsidó holokauszttúlélőknek a háborút közvetlenül követően, a Deportáltakat Gondozó Országos Bizottság (DEGOB) által felvett vallomásainak digitalizált adatbázisát.

Barna Ildikó és Knap Árpád részvétele a 2021-es ISCA konferencián

2020.12.30. Online antiszemitizmus

Örömhír. Barna Ildikó és Knap Árpád az Indiana University által szervezett 2021-es ISCA konferencia előadói között. Az “Antisemitism in Today’s America: Manifestations, Causes, and Consequences” c. konferencia az antiszemitizmus-kutatók egyik legfontosabb nemzetközi fóruma. Ildikó és Árpád a Soros Györggyel kapcsolatos, hazai és amerikai összeesküvés-elméletek összehasonlító elemzését mutatja be, online diskurzusok NLP-elemzését alkalmazva. Külön öröm számunkra, hogy a szervező intézetvezető szerint “Your paper promises to make an especially interesting contribution to our collective work on contemporary antisemitism.”
https://isca.indiana.edu/

Siker az ELTE TáTK-s Kari TDK-n

2020.12.13.

Csomor Gábor hallgatónk (Survey Statisztika és Adatanalitika MSc) első helyezést ért el a Kari TDK-n “Romákkal szembeni hivatali diszkrimináció mérése természetesnyelv-feldolgozással” c. dolgozatával. Témavezetője kutatócsoportunk tagja, Németh Renáta és Simonovits Borbála (ELTE PPK) volt. Gratulálunk!

Publikáció

2020.09.30.

Kutatócsoportunk három tagja (Németh RenátaKatona Eszter Rita, Kmetty Zoltán) szerzőségében született az a frissen megjelent cikk, aminek célja az automatizált szövegelemzés jellegzetességeinek és lehetőségeinek bemutatása. Céluk az volt, hogy ebbe az itthon még kevéssé intézményesült területbe betekintést engedve inspirációt nyújtsanak a hazai társadalomkutatók számára, mert meggyőződésük szerint a szövegbányászat néhány éven belül standard eszköze lesz a nemzetközi alkalmazott társadalomkutatásnak.

https://szociologia.hu/dynamic/44_62_oldal.pdf

RC2S2 előadások a “szociológia egy sikeres évszázad előtt?” konferencián

2020.09.21.

Október 8-9-én kerül megrendezésre “A szociológia egy sikeres évszázad előtt?” című konferencia az MTA Társadalomtudomány Kutatóközpontjában. A konferencián az NLP szociológiai alkalmazásai külön szekcióval szerepelnek, kutatócsoportunk két társvezetője, Barna Ildikó és Németh Renáta, valamint Ságvári Bence, az MTA CSS-Recens kutatócsoportjának vezetője javaslatára és szekcióvezetésével. A konferencia szervezőbizottságában Koltai Júlia, az RC2S2 tagja. Előadóként/társszerzőként szerepel  összesen 8 (!) előadással kutatócsoportunkból Barna Ildikó, Katona Eszter, Kmetty Zoltán, Knap Árpád, Koltai Júlia, Németh Renáta, Rakovics Márton, Sik Domonkos

A kutatócsoporthoz köthető előadások:

október 8. csütörtök

INNOVATÍV MÓDSZEREK A SZOCIOLÓGIAI KUTATÁSOKBAN

13:45-15:30 A természetes nyelvfeldolgozás lehetőségei és korlátai I.

Knap Árpád (társszerző: Barna Ildikó): Trianon és a holokauszt tematikus és diszkurzív keretezésének vizsgálata a természetesnyelv-feldolgozás segítésgével

Barna Ildikó (társszerző: Knap Árpád): A koronavírushoz kapcsolódó magyarországi online antiszemitizmus vizsgálata kvantitatív topikmodell és kvalitatív diskurzuselemzés segítségével

Németh Renáta (társszerzők: Sik Domonkos, Katona Eszter): Topikmodell használata a depresszió online diszkurzív keretezésének megértésében

15:45-17:30 A természetes nyelvfeldolgozás lehetőségei és korlátai II.

Katona Eszter (társszerzők: Kmetty Zoltán, Németh Renáta): Korrupció az online médiában. A dinamikus topikmodell alkalmazása

Máté Fanni: Osztályozó algoritmusok szociológusok számára

október 9. péntek

9:00-10:45 A COVID-19 járvány társadalmi hatásai I.

Koltai Júlia (társszerzők: Fodor Éva, Gregor Anikó, Kováts Eszter): Az egyenlőtlenségek alakulása a koronavírus idején Magyarországon

Társszerzőként:

Géring Zsuzsanna (társszerzők: Király Gábor, Rakovics Márton, Tamássy Réka): Jövő-konstrukciók a nemzetközi felsőoktatási intézményi diskurzusban

Stefkovics Ádám (társszerzők: Kmetty Zoltán, Koltai Júlia): Kísérletezz a módszereddel! A survey-kísérletek felhasználási lehetőségei a módszertan-fejlesztés területén

Tófalvy Tamás (társszerző: Koltai Júlia): A földrajzi egyenlőtlenségek algoritmikus újratermelődése a Spotify ajánlórendszerében

Kutatócsoportunk két tagja is ÚNKP-nyertes

2020.09.14.

Katona Eszter és Knap Árpád egyaránt elnyerte az Új Nemzeti Kiválósági Program (ÚNKP) ösztöndíját a következő egy éves időszakra. Eszter kutatásának címe Korrupciós kockázat és predikció – A közbeszerzési pályázatok szövegeinek elemzése a természetes nyelvfeldolgozás eszközeivel, témavezetője Fazekas Mihály. Eszter kutatásának hipotézise szerint a közbeszerzési pályázatok szövegezésének vizsgálata segíthet a korrupciógyanús esetek leleplezésében, kutatásában ezt igyekszik alátámasztani. Árpád Huszadik századi traumákkal kapcsolatos érzelmek elemzése szöveganalitikai módszerekkel című pályázatában a XX. századi magyar történelem két legnagyobb hatású eseményéhez, a Trianoni Békeszerződéshez, illetve a holokauszthoz kapcsolódó, a különböző típusú médiumokban és a közösségi médiában megjelenő érzelmeket elemzi majd. Témavezetője Barna Ildikó, kutatócsoportunk társvezetője.

Siker

2020.09.08.

Örömmel adjuk hírül, hogy hallgatónk, Csala-Ferencz Bernadett (Survey Statiszitika és Adatanalitika MSc) elnyerte az Új Nemzeti Kiválósági Program ösztöndíját az új szemeszterre. Pályázatának címe: Depresszió témájú online posztok exploratív klaszterezése. Bernadett a program támogatásával a Research Center for Computational Social Science kutatócsoport keretén belül Németh Renáta témavezetésével angol nyelvű online depresszió-fórumok posztjait kutatja natural language processing (NPL) módszerekkel.

Siker

2020.08.30.

Kutatócsapatunk óriási lehetőséget kapott – Az “OTKA” kutatási pályázat 2020. évi nyertesei között vagyunk! 2020-2023 közötti időszakra nyertünk támogatást, A politikai nyilvánosság rétegei Magyarországon (2001-2020) – a hivatalos, a médiabeli és a laikus online nyilvánosság szociológiai vizsgálata automatizált szövegelemzés és kritikai diskurzuselemzés használatával című kutatásra. Kutatásvezető: Németh Renáta.

A pályázat résztvevői: Barna Ildikó, Sik Domonkos, Rakovics Márton, Katona Eszter, Knap Árpád (RC2S2, ELTE TáTK) és Csigó Péter (BME).

A pályázat összefoglalója

Kutatásunk az NLP (Natural Language Processing: természetes nyelvfeldolgozás) innovatív, szociológiailag releváns módon való alkalmazásával a politikai nyilvánosságban detektálható nyelvhasználati változásokra koncentrál; ezeket a változásokat digitális szövegkorpuszon vizsgálja, a nyelvet mint az ideológia és hatalom eszközét tekintve, a kritikai diskurzuselemzés elméleti keretei között.

Két kiemelt, a társadalom, illetve a szociológia számára fontos tétje van a kutatásnak: (1) A politikai nyilvánosság különböző szintjeinek működése, e szintek közti interakció, ennek dinamikája, a nyelvben megmutatkozó ideológiai polarizáció, illetve olyan diskurzusok azonosítása, ahol ez nem érvényesül. (2) Az NLP módszertan szerves integrálása az empirikus szociológiába.

A kutatás mindkét eleme nemzetközileg is releváns, hiszen a vizsgált jelenség nem magyar sajátosság, máshol is tapasztalható a nyelvi polarizáció és a nyelvhasználati diffúziós folyamatok Az NLP módszertan szerves integrálása az empirikus szociológiába szintén kurrens, mert lehetőséget ad a nagy mennyiségben rendelkezésre álló digitális szövegek újfajta elemzésére úgy, hogy az eredmények interpretációjához felhasználja a szociológiai tudást.

Az adatgyűjtés és adatelemzés módszertani innovációit, a fejlesztett eszközöket nyilvánosságra hozzuk digitális repozitóriumokon, szakcikkeken és konferenciaelőadásokon, ezzel támogatva az NLP nemzetközi és hazai társadalomtudományi felhasználóit. A kutatócsoport szenior tagjai doktori témavezetőként fiatal kutatóknak, valamint szakmai gyakorlat és TDK/szakdolgozati témakiírás formájában egyetemi hallgatóknak lehetőséget teremtenek a projekthez való kapcsolódáshoz.

A kutatás jelentősége

A digitális forradalom az önkifejezés forradalma is. Míg korábban a szöveges dokumentumok főként az elit narratívái voltak, az internet megnyilvánulási lehetőséget ad gyakorlatilag bárki számára. Kutatásunk relevanciáját elsősorban az adja, hogy ennek a folyamatosan képződő szövegfolyamnak az automatizált feldolgozásával alátámaszthatóvá és megérthetővé teszi a politikai nyilvánosságnak azokat a sajátosságait, melyek a megfigyelők számára csak lokálisan észlelhetők. Kutatásunk tudományos és társadalmi tétje is nagy.

Tudományos szempontból kutatásunk a társadalomkutatás számára nyit perspektívát a survey önbevalláson alapuló információi helyett a megfigyeléses adatok kvantitatív kutatásba emelésével, a kvalitatív (diskurzuselemzés) és kvantitatív megközelítés kombinálásával, az informatikai-nyelvtechnológiai területről jövő módszerek innovatív társadalomkutatási felhasználásával. Mindez nemzetközi szinten is újdonságnak számít. A digitális kommunikáció különböző szintjeit lefedő nagyméretű szövegkorpusz NLP eszközökkel való elemzése tudomásunk szerint hazai közegben úttörő vállalkozás. Míg az erős ideológiai polarizációra vannak bizonyítékok (pl. Vegetti, 2018), és vizsgálták a politikai nyilvánosság networkösödésében megnyilvánuló polarizációt is (Bene és Szabó 2019), a nyelvi polarizáció itthon nem kutatott, és nemzetközi szinten is csak néhány előzményt találtunk, tervezett kutatásunknál jóval szerényebb alkalmazási területtel (lásd pl. Demszky és társai 2019, Twitter-adatokon).

Kutatásunk társadalmi tétje is jelentős: a nyilvánosság a modern képviseleti demokráciák alapköve, ahol fontos szerepet játszik a potenciális torzulások, krízisek megelőzésében.

A pályázat erőssége végül, hogy egy létező és rövid története ellenére sok sikert felmutatott kutatócsoport áll mögötte, nemzetközi publikációkkal, több doktori témával, tudatosan épített hazai és nemzetközi network-kel. A kutatócsoport célja az innovatív módszereket alkalmazó, a szociológiai tudományterületi tudást felhasználó kutatásokon kívül az is, hogy a hazai (és nemzetközi) szociológia számára új és perspektivikus megközelítés, az automatizált szöveganalitika társadalomkutatási intézményesülését elősegítse.

Publikáció

2020.08.25.

Kutatócsoportunk tagjainak (Németh Renáta, Sik Domonkos, Máté Fanni) írása az International Journal of Qualitative Methods (Q1, impakt faktor 3,6) lapjain. Amikor szociológusok alkalmaznak gépi tanulást: a “big data” szövegelemzés hermeneutikai korlátai nem-triviális fogalmak tanítása esetén. Örömmel olvastuk a lektori véleményekben miszerint “The article is the one of the fundamental researches in this area.” és “I look forward to seeing future efforts as you proceed with this research.” Az utóbbi kívánság, reméljük, teljesülni fog, online depresszió fórumok témában három nemzetközi publikációnk is bírálat alatt van.

A publikáció a következő linken olvasható: https://journals.sagepub.com/doi/full/10.1177/1609406920949338

További információk a projektről ezen az oldalon találhatók.

Online antiszemitizmussal foglalkozó kutatócsoportunk új, a koronavírussal összefüggő online antiszemitizmusról szóló projektbe kezdett

2020.07.27.

A zsidókat a történelem során sokszor vádolták azzal, hogy szándékosan betegségeket terjesztenek a nem zsidók között. A koronavírus járvány kitörésével egyidőben újra megjelentek a zsidókat a vírussal összekötő összeesküvés-elméletek. Ezeknek a konteóknak a terjesztésében az internetnek kiemelkedő jelentősége van. Kutatásunkban egy nagyméretű, magyar nyelvű online cikkekből és kommentekből álló szövegkorpuszt vizsgálunk arra a kutatási kérdésre keresve a választ, hogy megjelennek-e a fent említett diskurzusok a magyar adatokban, és ha igen, akkor mi ezek tartalma. Korpuszunk 2019. december 1. és 2020. június 10. közötti időszakban magyar nyelven írt cikkeket, hozzászólásokat, kommenteket tartalmaz, amelyekben egyszerre fordul elő a zsidó, Izrael vagy cionista szó és a koronavírus vagy ennek valamilyen más megnevezése. A koronavírussal összefüggő antiszemita diskurzus látens tematikus struktúrájának feltárására elsősorban topikmodelleket használunk. A kutatásban gyakornokként vesz részt a ELTE Társadalomtudományi Karának tizenöt, szociológia alapszakos hallgatója.

Siker

2020.07.21.

Örömmel jelentjük, hogy kutatócsoportunk tagjainak két szakdolgozója is elnyerte az „Év szakdolgozata” címet. Farkas Anna a szociológia BA-n (témavezető: Németh Renáta), Buda Jakab a Survey Statisztika és Adatanalitika MSc-n (témavezető: Rakovics Márton) írta a legjobb szakdolgozatot. Gratulálunk! A dolgozatok itt olvashatók, más CSS-témában íródott, kutatócsoportunk tagjai által vezetett dolgozattal együtt.

Vállalati együttműködés

2020.06.30.

Az Inspira Group kutatócég a “data for social good” elv mentén térítésmentesen tette lehetővé, hogy Farkas Anna szociológia BA-s hallgatónk szakdolgozatához online omnibusz kutatásukhoz kapcsolhasson kérdéseket. A Németh Renáta témavezetésével készült szakdolgozat az algoritmikus torzításnak nevezett jelenséget egy Google Fordítóról készült esettanulmányon keresztül mutatja be (a dolgozat ezen a linken érhető el), a nemi torzítást vizsgálva foglalkozások magyar-angol fordításánál („ő egy orvos” -> „he” vagy „she”?). A kutatás egyik célja a nemi torzítás mértékének (a szakirodalomban sokszor tévesen megközelített) definiálása volt – a fordításokat a foglalkozások valós nemi arányához viszonyította, illetve ahhoz, hogy a mai magyar társadalom hogyan gondolkodik a foglalkozásokról, azokat inkább nőiesnek vagy inkább férfiasnak tartja. Az Inspira ez utóbbiban segítette a kutatást: online omnibusz kutatásuk keretében, reprezentatív lakossági mintát kérdeztek a foglalkozások megítéléséről a szakdolgozó által megadott kérdések használatával. A dolgozat konklúziója szerint a Google Fordító fordításai inkább tükrözik a társadalom foglalkozásokról alkotott véleményét, mint a foglalkozások valós nemi arányát.

Szakmai megjelenés

2020.03.18.

Megjelent a Statisztikai Szemlében Brecsok Anna tavaly, a Survey Statisztika és Adatanalitika MSc-n készült szakdolgozata, amiben survey experimentet végzett egy olyan probléma vizsgálatára, amire a munkahelyén bukkant. A témavezető (és társszerző) kutatócsoportunk társ-vezetője, Németh Renáta volt.

A szociológia egy sikeres évszázad előtt? – konferencia NLP szekcióval

2020.03.10.

Megnyílt a jelentkezési lehetőség A szociológia egy sikeres évszázad előtt? című konferenciára, amely 2020. június 11-12 között kerül megrendezésre az MTA Társadalomtudomány Kutatóközpontjában. A konferencián az NLP szociológiai alkalmazásai külön szekcióval szerepelnek, kutatócsoportunk két társvezetője, Barna Ildikó és Németh Renáta, valamint Ságvári Bence, az MTA CSS-Recens kutatócsoportjának vezetője javaslatára és szekcióvezetésével. A konferenciára március 31-ig lehet jelentkezni.

Frissítés: a koronavírus kapcsán kialakult helyzet miatt bizonytalanná vált, hogy megtartásra kerül-e a konferencia júniusban. Ettől függetlenül azonban bátorítunk mindenkit, hogy adjon be absztraktot a megadott április 15-i határidőig (meghosszabbított határidő), mert a konferenciát meg fogjuk tartani, legrosszabb esetben egy későbbi időpontban.

Barna Ildikó előadása a prágai Károly Egyetemen

2020.02.20.
Barna Ildikó, kutatócsoportunk társvezetője előadást tartott a jelenkori magyarországi antiszemitizmusról a prágai Károly Egyetem Alkalmazott Nyelvészeti Intézetében. Az előadás alapját a Knap Árpáddal közösen végzett Online Antiszemitizmus kutatás jelentette. Előadásában a kutatás eddigi eredményeinek ismertetésén túl kitért arra is, hogy a természetesnyelv-feldolgozás outputjának interpretálásához miért nélkülözhetetlen a szociológiai és a szakterületi tudás.
Az előadásról további információ található az egyetem honlapján. A prezentációról készült videófelvétel ezen a linken tekinthető meg.

Kutatás és készségfejlesztés TDK-zó hallgatók számára, kutatócsoportunk részvételével

2020.02.19.

Kutatócsoportunk is képviselteti magát abban az ELTE TáTK TDK-műhelye által elnyert NTP-HHTDK pályázatban, amely a hazai Tudományos Diákköri műhelyek és rendezvényeik támogatására jött létre. Ennek keretében a tavaszi félévben Python-alapú szöveganalitikai tanfolyamot hirdetünk a kar hallgatói számára, amelyet követően lehetőség lesz szakmai gyakorlati munkát végezni kutatócsoportunkban.

NLP-s szekció az ISA RC33 ciprusi konferenciáján

2020.01.29.

Kutatócsoportunk két vezetője, Barna Ildikó és Németh Renáta sikeresen kezdeményezett egy szekciót “Natural Language Processing: a New Tool in the Methodological Tool-Box of Sociology” címmel az International Sociological Association RC33 (Logic and Methodology in Sociology) ciprusi konferenciáján, amelyet 2020. szeptember 8. és 11. között tartanak. A szekcióba január 30-áig várjuk az absztraktokat, amelyeket a konferencia weboldalán lehet benyújtani.