Zajszűrő eljárások alkalmazása, teljesítményük vizsgálata zajos beszéd automatikus felismerésénél

A jelen cikk célja több zajszr eljárás teljesítményének összehasonlítása autók bels terében történ automatikus beszédfelismeréskor. A kutatást autóban felvett hanganyagon végeztük el német nyelvre. A zajszr eljárások teljesítményének összehasonlítását egy csatornán végeztük. Négyféle zajszr eljárást...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Sztahó Dávid
Szaszák György
Vicsi Klára
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (6.) (2009) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2009
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 6
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58709
Leíró adatok
Tartalmi kivonat:A jelen cikk célja több zajszr eljárás teljesítményének összehasonlítása autók bels terében történ automatikus beszédfelismeréskor. A kutatást autóban felvett hanganyagon végeztük el német nyelvre. A zajszr eljárások teljesítményének összehasonlítását egy csatornán végeztük. Négyféle zajszr eljárást vizsgáltunk: Spectral Subtraction, Wiener-filter, Minimum Mean-Square Error Log-Spectral Amplitude Estimator, valamint modulációs spektrum szrésén alapuló zajcsökkentés. Minden eljárásnál használtunk egy felülátereszt szrt is, amellyel az autó mélyfrekvenciás zaját tudtuk kiküszöbölni. A beszédfelismerési tesztekre Rejtett Markov-modell alapú felismert használtunk. A tesztsorozatokat két részre bontottuk. Az els tesztsorozat során megvizsgáltuk az egyes zajszr eljárások alkalmazhatóságát a beszédfelismerésben úgy, hogy a TELEAUTO személygépkocsi belterében rögzített hanganyagot használtuk tanításra és tesztelésre is, az adott zajszr eljárás alkalmazása után. A második tesztsorozat során pedig megvizsgáltuk, hogy a SpeechDat adatbázissal betanított HMM modellekkel a szrt felvételek milyen eredményeket adnak a szretlen személygépkocsikban rögzített felvételekkel történ felismeréshez képest. A kapott eredmények azt mutatják, hogy a zajszr eljárások közül az MMSE adja a legjobb felismerési százalékot az általunk vizsgált módszerek közül. Továbbá a teszteredményekbl az is egyértelm, hogy a felismerés szempontjából az a leghatékonyabb eljárás, ha a zajos beszédfelismerésnél a hasonló zajban felvett beszédadatbázissal történik a betanítás.
Terjedelem/Fizikai jellemzők:195-205
ISBN:978-963-482-982-9