Fonetikai algoritmus a hanghatárok gépi meghatározásának javítására nagyméretű beszédadatbázisokban

A beszédtechnológiai kutatásokhoz és gyakorlati alkalmazásokhoz egyre nagyobb méretű beszédadatbázisokat terveznek. Ezek egyik fajtája, amikor előre meghatározott szöveg felolvasásával hozzák létre a több órányi beszédanyagot. Ilyen adatbázis például a BME TMIT időjárás jelentéseket tartalmazó beszé...

Teljes leírás

Elmentve itt :

Bibliográfiai részletek
Szerző:	Olaszy Gábor
Testületi szerző:	Magyar Számítógépes Nyelvészeti Konferencia (5.) (2007) (Szeged)
Dokumentumtípus:	Könyv része
Megjelent:	2007
Sorozat:	Magyar Számítógépes Nyelvészeti Konferencia 5
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Online Access:	http://acta.bibl.u-szeged.hu/58660

Leíró adatok
Tartalmi kivonat:	A beszédtechnológiai kutatásokhoz és gyakorlati alkalmazásokhoz egyre nagyobb méretű beszédadatbázisokat terveznek. Ezek egyik fajtája, amikor előre meghatározott szöveg felolvasásával hozzák létre a több órányi beszédanyagot. Ilyen adatbázis például a BME TMIT időjárás jelentéseket tartalmazó beszédkorpusza, amelyik 5400 mondatot tartalmaz. Ahhoz, hogy gépi módszerekkel lehessen ezt a hanganyagot a későbbiekben feldolgozni (szavakat, hangkapcsolatokat keresni stb.), a szöveget át kell írni hangszintű szimbólumsorozattá, majd jelölni kell a hanghullámon a hangokat, azok határát, a szavak kezdetét, a szüneteket, valamint szinkronba kell hozni a szöveget a hangzó formával automatikus gépi felismerés segítéségével. Az így jelölt hangok és hanghatárok csak mintegy 95%-os pontossággal adnak kellően helyes eredményt. Ez azonban nem elegendő a jó minőségű, korpusz alapú beszédszintézishez. Ebben a tanulmányban egy olyan utófeldolgozó algoritmust ismertetünk, amelyikkel növelni lehet a pontosságot, ezzel a szintézis minőségét.
Terjedelem/Fizikai jellemzők:	12-23
ISBN:	978-963-482-848-8

Fonetikai algoritmus a hanghatárok gépi meghatározásának javítására nagyméretű beszédadatbázisokban

Hasonló tételek