Kombinált központozási megoldások magyar nyelvre pehelysúlyú neurális hálózatokkal

Napjainkban a rekurrens neurális hálókon alapuló szekvenciamodellezés hatékony eszköznek bizonyult több, a természetesnyelv-feldolgozás (NLP) témaköréhez tartozó probléma megoldásában. Ide sorolhatjuk az írásjelek gépi úton történő visszaállítását, vagyis az automatikus központozást is, melynek sorá...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Tündik Máté Ákos
Szaszák György
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (15.) (2019) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2019
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 15
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59092
Leíró adatok
Tartalmi kivonat:Napjainkban a rekurrens neurális hálókon alapuló szekvenciamodellezés hatékony eszköznek bizonyult több, a természetesnyelv-feldolgozás (NLP) témaköréhez tartozó probléma megoldásában. Ide sorolhatjuk az írásjelek gépi úton történő visszaállítását, vagyis az automatikus központozást is, melynek során a szó- és/vagy akusztikai eseménysorozathoz írásjeleket rendelünk. Ezt a technikát pl. a beszédfelismerő központozatlan kimenetére alkalmazva a szöveg sokkal olvashatóbbá, érthetőbbé válik. Cikkünkben pehelysúlyú kombinált központozási megoldásokat mutatunk be, melyhez karakter- és szószintű beágyazás (embedding) vektorokat, valamint egy 39 dimenziós akusztikai jellemzővektort is felhasználunk. Kísérleteinket két magyar nyelvű, hírműsorokat, illetve felolvasást tartalmazó korpuszon végeztük el. Eredményeinkkel igazoljuk, hogy a kombinált módszerekkel hatékonyabb tud lenni az írásjelek visszaállítása, mintha csak egy-egy szöveges vagy akusztikus komponensre támaszkodnánk.
Terjedelem/Fizikai jellemzők:275-286
ISBN:978-963-315-393-2