Mozaik nyelvmodell az AnaGramma elemzőhöz

Cikkünkben bemutatjuk az elemző rendszerünkhöz a rendelkezésünkre álló nagyméretű magyar nyelvű korpuszok felhasználásával készített modult, amely szimulálni tudja az emberi elemzőkön megfigyelt jelenséget, miszerint bizonyos gyakori szerkezetek feldolgozása egyfajta gyorsítótárazás segítségével az...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Indig Balázs
Laki László János
Prószéky Gábor
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2016
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 12
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58981
Leíró adatok
Tartalmi kivonat:Cikkünkben bemutatjuk az elemző rendszerünkhöz a rendelkezésünkre álló nagyméretű magyar nyelvű korpuszok felhasználásával készített modult, amely szimulálni tudja az emberi elemzőkön megfigyelt jelenséget, miszerint bizonyos gyakori szerkezetek feldolgozása egyfajta gyorsítótárazás segítségével az átlagosnál gyorsabb. Létrehoztunk egy olyan rendszert, amellyel 3-nál magasabb gramok esetén, több faktor kombinálásával gyakori mintákat tud előállítani. Megvizsgáltuk a keletkezett mintákat, a szintaktikai elemzés gyorsításának szempontjából, beleértve az őket alkotó példák különböző teljes kifejtésű eloszlásait. Az ilyen minták megfigyelésével a szakértő szemlélő további ötleteket nyerhet, a korpuszon megfigyelhető jelenségek keresésére. Felsorolunk továbbá néhány az elemző szempontjából érdekes példákat is.
Terjedelem/Fizikai jellemzők:260-270
ISBN:978-963-306-450-4