Csaba Enikő – Szóbeágyazási vektorterek illesztési problémájának megoldása Prokrusztész transzformációval

2023 Survey Statisztika és Adatanalitika MSc Konzulens Rakovics Márton

Csaba Enikő

A dolgozat kísérletet tesz két, eltérő társadalomszemléletű online hírportál cikkeiből létrehozott korpusz összehasonlítására szóbeágyazási vektorterek összeillesztésével, annak érdekében, hogy definiálja a különböző kontextusból eredő eltéréseket. Emellett a dolgozat további célja annak meghatározása, mennyire alkalmas eszköz a Prokrusztész transzformáció a vektorreprezentációk közös térbe való illesztésére. Különböző szóbeágyazások tanításával először a feladatra legalkalmasabb modell kiválasztása történik meg, majd a Prokrusztész-transzformációk végrehajtása és kiértékelése. A legalacsonyabb közelítési hibával rendelkező transzformáció kijelölése után pedig sor került az összeillesztett vektortér elemzésére. Az eredmények egyrészről alátámasztják, hogy a Prokrusztész transzformáció alkalmas a beágyazások eltéréséből fakadó illesztési probléma kezelésére, másrészről azonosít téma-specifikus szavakat, melyek eltérő kontextusban jelennek meg a két médiumban.

Szakdolgozat megtekintése