Magyar nyelvű, élő közéleti- és hírműsorok gépi feliratozása

Cikkünkben egy valós idejű, kis erőforrás-igényű gépi beszéd-szöveg átalakító rendszert mutatunk be, melyet elsősorban televíziós közéleti társalgási beszéd feliratozására fejlesztettünk ki. Megoldásunkat összevetjük a tématerületen legelterjedtebben használt nyílt forráskódú keretrendszer, a Kaldi...

Full description

Saved in:
Bibliographic Details
Main Authors: Tarján Balázs
Varga Ádám
Tobler Zoltán
Szaszák György
Fegyó Tibor
Bordás Csaba
Mihajlik Péter
Corporate Author: Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged)
Format: Article
Published: 2016
Series:Magyar Számítógépes Nyelvészeti Konferencia 12
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58965
Description
Summary:Cikkünkben egy valós idejű, kis erőforrás-igényű gépi beszéd-szöveg átalakító rendszert mutatunk be, melyet elsősorban televíziós közéleti társalgási beszéd feliratozására fejlesztettünk ki. Megoldásunkat összevetjük a tématerületen legelterjedtebben használt nyílt forráskódú keretrendszer, a Kaldi dekóderével is. Ezen felül különböző adatbázis-méretek mellett és újrabeszélés alkalmazásával is végzünk felismerési kísérleteket. Kísérleti rendszerünkkel, mely egy több mint 70 millió szót tartalmazó szövegkorpuszon és egy közel 500 órás beszédadatbázison lett tanítva sikerült az eddig publikált legalacsonyabb szóhibaarányt elérnünk magyar nyelvű, televíziós híradók és közéleti társalgási beszéd témakörén.
Physical Description:89-99
ISBN:978-963-306-450-4