Középszótáras folyamatos beszédfelismerőrendszer fejlesztési tapasztalatai

A Beszédakusztikai Laboratóriumban kifejlesztésre került egy Windows XP alatt mköd�, statisztikai elvi alapokra épülő, folyamatos beszédfelismerő fejlesztői környezet (MKBF 1.0), amely alkalmas különböző középszótáras 1000-10 000 szavas szövegek betanítására és felismerésére. Új megoldásokat dolgozt...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Vicsi Klára
Velkei Szabolcs
Szaszák György
Borostyán Gábor
Teleki Csaba
Tóth Szabolcs Levente
Gordos Géza
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2005
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 3
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58592
LEADER 02194naa a2200265 i 4500
001 acta58592
005 20221108115103.0
008 190613s2005 hu o 1|| zxx d
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Vicsi Klára 
245 1 0 |a Középszótáras folyamatos beszédfelismerőrendszer fejlesztési tapasztalatai  |h [elektronikus dokumentum] /  |c  Vicsi Klára 
260 |c 2005 
300 |a 348-359 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 3 
520 3 |a A Beszédakusztikai Laboratóriumban kifejlesztésre került egy Windows XP alatt mköd�, statisztikai elvi alapokra épülő, folyamatos beszédfelismerő fejlesztői környezet (MKBF 1.0), amely alkalmas különböző középszótáras 1000-10 000 szavas szövegek betanítására és felismerésére. Új megoldásokat dolgoztunk ki az akusztikai előfeldolgozásban, a statisztikai modellépítésben valamint fonetikai, fonológiai és morféma nyelvi szinteket vonunk be a felismerési folyamatba. A felismerő a statisztikai alapon működő HMM akusztikai fonémamodellekkel valamint a statisztikai alapú bigram nyelvi modellekel mködik, nem lineáris simítást használva. Vizsgálataink során változtattuk a betanító anyagokat, a szótárkészletet. Kétfajta bigram alappal dolgoztunk: először a hagyományos ragozott szóalakokból építettük fel a bigram mezőket, majd a szóalakokat morfémákra bontottuk, és ezekből a morfémákból építkeztünk. A cikkben a tesztelés eredményeiről, a továbbfejlesztéshez nyert tapasztalatainkról számolunk be. A perplexitási vizsgálatok eredményeinek felhasználásával a felismerési biztonságot 70%-ról 91% fölé tudtuk vinni. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Velkei Szabolcs  |e aut 
700 0 1 |a Szaszák György  |e aut 
700 0 1 |a Borostyán Gábor  |e aut 
700 0 1 |a Teleki Csaba  |e aut 
700 0 1 |a Tóth Szabolcs Levente  |e aut 
700 0 1 |a Gordos Géza  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/58592/1/msznykonf_003_348-359.pdf  |z Dokumentum-elérés