Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása

Cikkünkben egy valós idejű, kis erőforrás-igényű gépi beszéd-szöveg átalakító rendszert mutatunk be, melyet elsősorban televíziós közéleti társalgási beszéd feliratozására fejlesztettünk ki. Megoldásunkat összevetjük a tématerületen legelterjedtebben használt nyílt forráskódú keretrendszer, a Kaldi...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Tarján Balázs
Varga Ádám
Tobler Zoltán
Szaszák György
Fegyó Tibor
Bordás Csaba
Mihajlik Péter
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2016
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 12
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58965
LEADER 01800naa a2200277 i 4500
001 acta58965
005 20221108114937.0
008 190701s2016 hu o 1|| zxx d
020 |a 978-963-306-450-4 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Tarján Balázs 
245 1 0 |a Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása  |h [elektronikus dokumentum] /  |c  Tarján Balázs 
260 |c 2016 
300 |a 89-99 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 12 
520 3 |a Cikkünkben egy valós idejű, kis erőforrás-igényű gépi beszéd-szöveg átalakító rendszert mutatunk be, melyet elsősorban televíziós közéleti társalgási beszéd feliratozására fejlesztettünk ki. Megoldásunkat összevetjük a tématerületen legelterjedtebben használt nyílt forráskódú keretrendszer, a Kaldi dekóderével is. Ezen felül különböző adatbázis-méretek mellett és újrabeszélés alkalmazásával is végzünk felismerési kísérleteket. Kísérleti rendszerünkkel, mely egy több mint 70 millió szót tartalmazó szövegkorpuszon és egy közel 500 órás beszédadatbázison lett tanítva sikerült az eddig publikált legalacsonyabb szóhibaarányt elérnünk magyar nyelvű, televíziós híradók és közéleti társalgási beszéd témakörén. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Varga Ádám  |e aut 
700 0 1 |a Tobler Zoltán  |e aut 
700 0 1 |a Szaszák György  |e aut 
700 0 1 |a Fegyó Tibor  |e aut 
700 0 1 |a Bordás Csaba  |e aut 
700 0 1 |a Mihajlik Péter  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/58965/1/msznykonf_012_089-099.pdf  |z Dokumentum-elérés