Vektortér alapú szemantikai szóhasonlósági vizsgálatok

A bemutatott kísérletben kiválasztott szavakat a környezetükben előforduló szavak gyakorisági adataiból képzett vektorokkal reprezentáljuk, a vektorok összehasonlításával pedig a szavak szemantikai hasonlóságára következtetünk. A kísérleti rendszer egy feleletválasztásos feladatot old meg, melyben 3...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerző: Tóth Ágoston
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (9.) (2013) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2013
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 9
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58863
Leíró adatok
Tartalmi kivonat:A bemutatott kísérletben kiválasztott szavakat a környezetükben előforduló szavak gyakorisági adataiból képzett vektorokkal reprezentáljuk, a vektorok összehasonlításával pedig a szavak szemantikai hasonlóságára következtetünk. A kísérleti rendszer egy feleletválasztásos feladatot old meg, melyben 30 célszó mindegyikéhez automatikusan kiválasztjuk a hozzá leghasonlóbb szót. A vizsgálandó szavak listáján 15 szemantikailag motivált párt találunk, köztük ellentéteket, szinonimákat és alá-/fölérendelt szavakat; kimenetként mindegyik szó párját vártuk visszakapni. A helyes választ a rendszernek mind a 30 szóhoz összesen 100 potenciális jelölt közül kellett kiválasztania. A pontosság maximális értéke (20 millió szavas korpusz feldolgozása után) 79% volt. A vektorokat a Magyar Webkorpuszból vett, annotációt nem tartalmazó szövegek segítségével állítottam elő, a vektorok kiszámítását és összehasonlítását saját fejlesztésű programmal végeztem.
Terjedelem/Fizikai jellemzők:354-360
ISBN:978-963-306-189-3