Audiovizuális beszédfelismerés

Az emberi beszédértés bimodális természetű: az akusztikus és vizuális jelet zseniálisan kombináljuk a maximális érthetőség érdekében. Különösen zajos környezetben segíti a beszéd jobb megértését a vizuális jel. A szájról olvasás feladatát próbálom gépi úton megvalósítani. Az audiovizuális beszédfeli...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerző: Czap László
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (2.) (2004) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2004
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 2
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59292
Leíró adatok
Tartalmi kivonat:Az emberi beszédértés bimodális természetű: az akusztikus és vizuális jelet zseniálisan kombináljuk a maximális érthetőség érdekében. Különösen zajos környezetben segíti a beszéd jobb megértését a vizuális jel. A szájról olvasás feladatát próbálom gépi úton megvalósítani. Az audiovizuális beszédfelismerés fő kérdései, hogy mely jellemzők hordozzák a lényegi vizuális információt, és hogy ezek hogyan nyerhetők ki a képből. A geometriai és pixel bázisú lényegkiemelést a folyamatos beszédfelismerés szempontjai szerint még nem hasonlították össze. Arra a kérdésre is választ kerestem, hogy eséllyel léphet-e fel a diádok vetélytársaként a félszótag, mint a felismerés alapegysége.
Terjedelem/Fizikai jellemzők:293-300