Az akusztikus szózsák eljárás korpuszfüggetlenségének vizsgálata

Cikkünkben egy jellemzőreprezentációs módszer, az akusztikus szózsák (Bag of Audio Words, BoAW) metódus szélesebb körű használhatóságát elemezzük. A BoAW eljárás lehetővé teszi a változó hosszúságú hangminták fix méretű jellemzővektorokként való kezelését. Ezáltal a különböző hangadatbázisok kezelhe...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Vetráb Mercedes
Gosztolya Gábor
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2020
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 16
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/67668
Leíró adatok
Tartalmi kivonat:Cikkünkben egy jellemzőreprezentációs módszer, az akusztikus szózsák (Bag of Audio Words, BoAW) metódus szélesebb körű használhatóságát elemezzük. A BoAW eljárás lehetővé teszi a változó hosszúságú hangminták fix méretű jellemzővektorokként való kezelését. Ezáltal a különböző hangadatbázisok kezelhetővé és taníthatóvá válnak a hagyományos tanulóalgoritmusokkal is. A BoAW eljárás kezdeti lépésében klaszterközéppontokat (ún. kódszavakat) határozunk meg a keretszintű jellemzővektorok fölött valamilyen felügyelet nélküli módszerrel (pl. kmeans klaszterezéssel, vagy akár csak véletlenszerű kiválasztással). Ezt a lépést hagyományosan az adott akusztikus adatbázis tanító halmazán szokás elvégezni. Ez azonban amellett, hogy minden adatbázison új kódszavak kiválasztását teszi szükségessé, így megnyújtva a jellemzőreprezentációk előállításának idejét, akár túlillesztést is okozhat. Jelen tanulmányunkban megvizsgáljuk, hogy mennyire korpuszfüggő az előálló kódszóhalmaz. Kísérleteinkben egy magyar nyelvű érzelemadatbázison mérünk osztályozási eredményeket, miközben a kódszavak kiválasztása vagy egy német nyelvű érzelemadatbázison, vagy egy magyar nyelvű, általános beszédadatbázison történik. Eredményeink szerint mindkét új típusú megközelítéssel elérhető, a korábban említett hagyományos megközelítéssel elérhető osztályozási pontosság, ami megkönnyítheti a BoAW eljárás gyakorlati alkalmazását.
Terjedelem/Fizikai jellemzők:219-231
ISBN:978-963-306-719-2