Lényegkiemelő módszerek összehasonlítása közlekedési zajban történő beszédfelismerés céljából

A gépi beszédfelismerés egyik dönt fontosságú eleme a beszéd akusztikai lényegének kiemelése, különösen a zajos környezetben történ alkalmazásoknál, amely jelen esetben közlekedési zajjal terhelt akusztikai környezetet jelentett. Emiatt helyeztük vizsgálatunk középpontjába a zajtr és hagyományos bes...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Sárosi Gellért
Tobler Zoltán
Mihajlik Péter
Fegyó Tibor
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2010
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 7
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58781
LEADER 01879naa a2200241 i 4500
001 acta58781
005 20221108115023.0
008 190624s2010 hu o 1|| zxx d
020 |a 978-963-306-075-9 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Sárosi Gellért 
245 1 0 |a Lényegkiemelő módszerek összehasonlítása közlekedési zajban történő beszédfelismerés céljából  |h [elektronikus dokumentum] /  |c  Sárosi Gellért 
260 |c 2010 
300 |a 384-388 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 7 
520 3 |a A gépi beszédfelismerés egyik dönt fontosságú eleme a beszéd akusztikai lényegének kiemelése, különösen a zajos környezetben történ alkalmazásoknál, amely jelen esetben közlekedési zajjal terhelt akusztikai környezetet jelentett. Emiatt helyeztük vizsgálatunk középpontjába a zajtr és hagyományos beszédfelismerési lényegkiemelési eljárásokat. A tanítást és tesztelést hat nyelven végeztük el: angol, francia, magyar, német, olasz, spanyol. Teszteléshez a telefonos hálózaton keresztül az utcáról vagy jármbl rögzített adatbázist használtunk. Alaprendszerként teszteltük a HTK és a SPHINX eszközkészletben, vagy általunk is implementált Mel Frequency Cepstral Coefficients (MFCC) és Perceptual Linear Prediction (PLP) módszereket. Az újabb módszerek között a Power-Normalized Cepstral Coefficients (PNCC) és a Perceptual Minimum Variance Distortionless Response (PMVDR) szerepel. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Tobler Zoltán  |e aut 
700 0 1 |a Mihajlik Péter  |e aut 
700 0 1 |a Fegyó Tibor  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (7.) (2010) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/58781/1/msznykonf_007_384-388.pdf  |z Dokumentum-elérés