Automatikus hibajavítás statikus szövegeken
Kutatásunk célja egy olyan neurális hálózat alapú automatikus hibajavító eszköz létrehozása, amely képes a korpuszok sztenderdizálására. A különböző nyelvtechnológiai feladatok modelljeinek betanításához fontos, hogy a tanítókorpuszok minél kevesebb zajt illetve hibát tartalmazzanak, hiszen a gyenge...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2021
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
17 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Tárgyszavak: | |
Online Access: | http://acta.bibl.u-szeged.hu/73372 |
Tartalmi kivonat: | Kutatásunk célja egy olyan neurális hálózat alapú automatikus hibajavító eszköz létrehozása, amely képes a korpuszok sztenderdizálására. A különböző nyelvtechnológiai feladatok modelljeinek betanításához fontos, hogy a tanítókorpuszok minél kevesebb zajt illetve hibát tartalmazzanak, hiszen a gyenge minőségű tanítókorpuszok rendszerint rosszabb eredményekhez vezethetnek. Az interneten elérhető szövegek nagy része informális, nem ellenőrzött forrásból (pl. közösségi média, fórumok) származik. Tanulmányunkban a közösségi médiában gyakran előforduló gyakori hibákra fókuszálunk. Célunk feltárni és elemezni a hibatípusokat, majd az előfordulásuk alapján statisztikát készíteni. A kiszámolt hiba-előfordulások arányát felhasználjuk egy hibajavító modell tanítására. Kutatásunkban egy transzformer modellen alapuló neurális gépi fordító rendszert használtunk fel a hibajavító modell tanítására. Eredményeink azt mutatják, hogy a neurális gépi fordítás módszere alkalmas a feladatra, azonban több olyan hibatípus is létezik, amelyek további kutatást igényelnek. |
---|---|
Terjedelem/Fizikai jellemzők: | 243-252 |
ISBN: | 978-963-306-781-9 |