Slerosis multiplex felismerése spontán beszédből wav2vec 2.0 modellekből kinyert jellemzőkkel

A slerosis multiplex (SM) a központi idegrendszer krónikus gyulladásos megbetegedése. Mivel az SM többek között az alanyok beszédét is befolyásolja, az automatikus beszédelemzés egyszer¶, relatíve ol só és találkozásmentes (távoli) módot kínálhat a beszédproduk ió változásainak detektálására. Egy il...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Gosztolya Gábor
Egas-López José Vicente
Svindt Veronika
Bóna Judit
Hoffmann Ildikó
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (19.)
Dokumentumtípus: Könyv része
Megjelent: 2023
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 19
Kulcsszavak:Nyelvészet - számítógép alkalmazása - egészségügy, Slerosis multiplex
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/78402
LEADER 02793naa a2200301 i 4500
001 acta78402
005 20230314145414.0
008 230314s2023 hu o 1|| hun d
020 |a 978-963-306-912-7 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a hun 
100 1 |a Gosztolya Gábor 
245 1 0 |a Slerosis multiplex felismerése spontán beszédből wav2vec 2.0 modellekből kinyert jellemzőkkel  |h [elektronikus dokumentum] /  |c  Gosztolya Gábor 
260 |c 2023 
300 |a 33-43 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 19 
520 3 |a A slerosis multiplex (SM) a központi idegrendszer krónikus gyulladásos megbetegedése. Mivel az SM többek között az alanyok beszédét is befolyásolja, az automatikus beszédelemzés egyszer¶, relatíve ol só és találkozásmentes (távoli) módot kínálhat a beszédproduk ió változásainak detektálására. Egy ilyen automatikus elemz® eljárás fejlesztésének során azonban kritikusnak bizonyulhat, hogy milyen jellemz®ket nyerünk ki a beszédproduktumból. Cikkünkben tíz wav2ve 2.0 modell segítségével számítunk jellemz®ket, az így kapott osztályozási eredményeket pedig nagymennyiség¶ adaton tanított publikus, valamint kevesebb, de magyar nyelv¶ adaton magunk által tanított x-vektor neurális hálók használatával kapott eredményekkel is összevetjük. Kísérleteinkben a többnyelv¶ fonetikus készletre tanított wav2ve 2.0 modellek hatékonyabbnak bizonyultak, mint az alap (�base�) modellek. A legfontosabb attribútumnak ugyanakkor a modell paraméterszáma t¶nik: a legjobb eredményt az egymilliárd tanítható paraméterrel bíró modell adta. Emellett azt találtuk, hogy a modell �nomhangolása a élnyelvre (esetünkben a magyarra) javít az eredményeken, ugyanakkor (legalábbis kísérleti eredményeink alap ján) más nyelvre �nomhangolni nem érdemes. Meglep® módon nem sikerült viszont túlszárnyalnunk az x-vektorok teljesítményét, mely véleményünk szerint valószín¶leg a keretszint¶ beágyazások bevett, de talán túlságosan egyszer¶ felvételszint¶ aggregá ió jának tudható be. 
650 4 |a Természettudományok 
650 4 |a Számítás- és információtudomány 
650 4 |a Orvos- és egészségtudomány 
650 4 |a Általános orvostudomány 
695 |a Nyelvészet - számítógép alkalmazása - egészségügy, Slerosis multiplex 
700 0 2 |a Egas-López José Vicente  |e aut 
700 0 2 |a Svindt Veronika  |e aut 
700 0 2 |a Bóna Judit  |e aut 
700 0 2 |a Hoffmann Ildikó  |e aut 
711 |a Magyar számítógépes nyelvészeti konferencia (19.)  |c Szeged  |d 2023. január 26-27. 
856 4 0 |u http://acta.bibl.u-szeged.hu/78402/1/msznykonf_019_033-043..pdf  |z Dokumentum-elérés