Finnugor nyelvű közösségek nyelvtechnológiai támogatása online tartalmak létrehozásában

A cikkben bemutatott folyamatban levő projekt célja, hogy kisebb finnugor nyelvekre állítson elő nyelvi erőforrásokat, amelyekkel revitalizálni lehet ezeket a veszélyeztett nyelvi közösségeket. A projekt során párhuzamos és összevethető korpuszokból kétnyelvű protoszótárakat állítunk elő, melyeket a...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Benyeda Ivett
Koczka Péter
Ludányi Zsófia
Simon Eszter
Váradi Tamás
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2015
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 11
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58927
Leíró adatok
Tartalmi kivonat:A cikkben bemutatott folyamatban levő projekt célja, hogy kisebb finnugor nyelvekre állítson elő nyelvi erőforrásokat, amelyekkel revitalizálni lehet ezeket a veszélyeztett nyelvi közösségeket. A projekt során párhuzamos és összevethető korpuszokból kétnyelvű protoszótárakat állítunk elő, melyeket anyanyelvi beszélők fognak ellenőrizni. A különböző nyelvű, egymásnak megfeleltetett szóalakok morfológiai, lexikai, etimológiai információkkal kibővítve kerülnek majd feltöltésre a Wiktionarybe. A projekt során számolnunk kell azzal a nehézséggel, hogy nyelvtechnológiai erőforrások a kisebb finnugor nyelvekre kevéssé állnak rendelkezésre, ezért a szövegfeldolgozás során nyelvfüggetlen gépi tanulási módszereket alkalmazunk. A projekt összes melléktermékét (modellek, korpuszok, szövegfeldolgozó eszközláncok, elemzett szövegek) nyilvánosan elérhetővé tesszük.
Terjedelem/Fizikai jellemzők:133-144
ISBN:978-963-306-359-0