Magyar nyelvű diktáló rendszer támogatása újszerű nyelvi modellek segítségével

Cikkünkben újszer megoldásokat javasolunk a valós idejű beszédfelismeréshez szükséges nyelvi modellek területén, a felismerési pontosság és sebesség növelése érdekében. Különböző nyelvi modellek (pl. szabály alapú modellek, fonéma N-gram, szó és szócsoport N-gram modellek) párhuzamos futtatásával, i...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Bánhalmi András
Kocsor András
Paczolay Dénes
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2005
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 3
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58591
Leíró adatok
Tartalmi kivonat:Cikkünkben újszer megoldásokat javasolunk a valós idejű beszédfelismeréshez szükséges nyelvi modellek területén, a felismerési pontosság és sebesség növelése érdekében. Különböző nyelvi modellek (pl. szabály alapú modellek, fonéma N-gram, szó és szócsoport N-gram modellek) párhuzamos futtatásával, illetve aggregálásával egyrészt a szó N-gram simítása, másrészt a hipotézisek számának hatékonyabb csökkentése érhető el. A szócsoport Ngramok kiértékeléséhez a szavak csoportosítását a szavak mondattani szerepét leíró MSD-kódok (Morpho Syntactic Description) [3] felhasználásával végeztük el. Az N-gram alapú statisztikai modellek hagyományos kiértékelés esetén csak az n. szó teljes felismerése után szolgáltatnak valószínségi értékeket. Olyan eljárásokat is kidolgoztunk, amelyek használatával már az n. szó felismerésének befejezése előtt rendelkezésre állnak közelítő valószínségi becslések.
Terjedelem/Fizikai jellemzők:337-347