Zajszűrő eljárások alkalmazása, teljesítményük vizsgálata zajos beszéd automatikus felismerésénél
A jelen cikk célja több zajszr eljárás teljesítményének összehasonlítása autók bels terében történ automatikus beszédfelismeréskor. A kutatást autóban felvett hanganyagon végeztük el német nyelvre. A zajszr eljárások teljesítményének összehasonlítását egy csatornán végeztük. Négyféle zajszr eljárást...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2009
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
6 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/58709 |
Tartalmi kivonat: | A jelen cikk célja több zajszr eljárás teljesítményének összehasonlítása autók bels terében történ automatikus beszédfelismeréskor. A kutatást autóban felvett hanganyagon végeztük el német nyelvre. A zajszr eljárások teljesítményének összehasonlítását egy csatornán végeztük. Négyféle zajszr eljárást vizsgáltunk: Spectral Subtraction, Wiener-filter, Minimum Mean-Square Error Log-Spectral Amplitude Estimator, valamint modulációs spektrum szrésén alapuló zajcsökkentés. Minden eljárásnál használtunk egy felülátereszt szrt is, amellyel az autó mélyfrekvenciás zaját tudtuk kiküszöbölni. A beszédfelismerési tesztekre Rejtett Markov-modell alapú felismert használtunk. A tesztsorozatokat két részre bontottuk. Az els tesztsorozat során megvizsgáltuk az egyes zajszr eljárások alkalmazhatóságát a beszédfelismerésben úgy, hogy a TELEAUTO személygépkocsi belterében rögzített hanganyagot használtuk tanításra és tesztelésre is, az adott zajszr eljárás alkalmazása után. A második tesztsorozat során pedig megvizsgáltuk, hogy a SpeechDat adatbázissal betanított HMM modellekkel a szrt felvételek milyen eredményeket adnak a szretlen személygépkocsikban rögzített felvételekkel történ felismeréshez képest. A kapott eredmények azt mutatják, hogy a zajszr eljárások közül az MMSE adja a legjobb felismerési százalékot az általunk vizsgált módszerek közül. Továbbá a teszteredményekbl az is egyértelm, hogy a felismerés szempontjából az a leghatékonyabb eljárás, ha a zajos beszédfelismerésnél a hasonló zajban felvett beszédadatbázissal történik a betanítás. |
---|---|
Terjedelem/Fizikai jellemzők: | 195-205 |
ISBN: | 978-963-482-982-9 |