Magyar ismeretlen szó-elemző program fejlesztése

Nagy korpuszok szám ítógépes feldolgozása során elkerülhetetlenül beleütközünk abba a problém ába, hogy a szövegekben szereplő szóalakok igen jelentős részét nem tu dja a rendelkezésre álló morfológiai elemzőprogram elemezni, mert hiányzik az adatbázisából a szó töve. Ugyanakkor ezeknek az elem ezhe...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Novák Attila
Nagy Viktor
Oravecz Csaba
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2003
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 1
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59435
Leíró adatok
Tartalmi kivonat:Nagy korpuszok szám ítógépes feldolgozása során elkerülhetetlenül beleütközünk abba a problém ába, hogy a szövegekben szereplő szóalakok igen jelentős részét nem tu dja a rendelkezésre álló morfológiai elemzőprogram elemezni, mert hiányzik az adatbázisából a szó töve. Ugyanakkor ezeknek az elem ezhetetlen szóalakoknak a nagy része tartalmaz toldalékokat, ezért valamilyen módon ezeket is elemezni kell. Ennek a problém ának a kezelésére olyan hibrid eljárást lehet alkalmazni, amely szimbolikus parciális morfológiai elemzőből és egy olyan statisztikai alapú eszközből áll, amely az első lépésben a szimbolikus ismeretlenszó-elemző által előállított hipotézisteret a kívánt mértékűre szűkíti.
Terjedelem/Fizikai jellemzők:45-54