Lényegkiemelő módszerek összehasonlítása közlekedési zajban történő beszédfelismerés céljából

A gépi beszédfelismerés egyik dönt fontosságú eleme a beszéd akusztikai lényegének kiemelése, különösen a zajos környezetben történ alkalmazásoknál, amely jelen esetben közlekedési zajjal terhelt akusztikai környezetet jelentett. Emiatt helyeztük vizsgálatunk középpontjába a zajtr és hagyományos bes...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Sárosi Gellért
Tobler Zoltán
Mihajlik Péter
Fegyó Tibor
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2010
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 7
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58781
Leíró adatok
Tartalmi kivonat:A gépi beszédfelismerés egyik dönt fontosságú eleme a beszéd akusztikai lényegének kiemelése, különösen a zajos környezetben történ alkalmazásoknál, amely jelen esetben közlekedési zajjal terhelt akusztikai környezetet jelentett. Emiatt helyeztük vizsgálatunk középpontjába a zajtr és hagyományos beszédfelismerési lényegkiemelési eljárásokat. A tanítást és tesztelést hat nyelven végeztük el: angol, francia, magyar, német, olasz, spanyol. Teszteléshez a telefonos hálózaton keresztül az utcáról vagy jármbl rögzített adatbázist használtunk. Alaprendszerként teszteltük a HTK és a SPHINX eszközkészletben, vagy általunk is implementált Mel Frequency Cepstral Coefficients (MFCC) és Perceptual Linear Prediction (PLP) módszereket. Az újabb módszerek között a Power-Normalized Cepstral Coefficients (PNCC) és a Perceptual Minimum Variance Distortionless Response (PMVDR) szerepel.
Terjedelem/Fizikai jellemzők:384-388
ISBN:978-963-306-075-9