Szövegaugmentálási módszerek összehasonlítása politikai szövegek szentimentanalízise során
Cikkünkben bemutatjuk a gépi tanítási feladatokban gyakran előforduló kiegyensúlyozatlan tanítóhalmaz probléma egy lehetséges megoldását az alacsony elemszámú kategóriák szöveg-augmentálásával. Az összevethetőség érdekében egyszerű szövegaugmentálási technikákkal (EDA) és egy szóvektor alapú módszer...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2022
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
18 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Tárgyszavak: | |
Online Access: | http://acta.bibl.u-szeged.hu/75897 |
Tartalmi kivonat: | Cikkünkben bemutatjuk a gépi tanítási feladatokban gyakran előforduló kiegyensúlyozatlan tanítóhalmaz probléma egy lehetséges megoldását az alacsony elemszámú kategóriák szöveg-augmentálásával. Az összevethetőség érdekében egyszerű szövegaugmentálási technikákkal (EDA) és egy szóvektor alapú módszerrel is kísérletet teszünk. A módszerek hatékonyságát politikai doménbe tartozó szövegek szentimentelemzési feladatán teszteljük, amihez a TK-MILAB szentiment korpusz egy kisebb szeletét használjuk. Az alulreprezentált kategória bővítésével elért eredményeket a kiváltott F-érték változás függvényében értékeljük. |
---|---|
Terjedelem/Fizikai jellemzők: | 521-534 |
ISBN: | 978-963-306-848-9 |