Mennyiségből minőséget nyelvtechnológiai kihívások és tanulságok az MNSz új változatának elkészítésében /

A Magyar Nemzeti Szövegtár egymilliárd szavas új változatának fejlesztése során egyrészt a szövegek mennyiségéből, másrészt a nyelvi elemzés minőségével kapcsolatos elvárásokból adódóan számos olyan feldolgozási kérdés merült fel, melyekre nem lehetett a jelenleg hozzáférhető nyelvi elemző eszközök...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Oravecz Csaba
Sass Bálint
Váradi Tamás
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (11.) (2015) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2015
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 11
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58925
Leíró adatok
Tartalmi kivonat:A Magyar Nemzeti Szövegtár egymilliárd szavas új változatának fejlesztése során egyrészt a szövegek mennyiségéből, másrészt a nyelvi elemzés minőségével kapcsolatos elvárásokból adódóan számos olyan feldolgozási kérdés merült fel, melyekre nem lehetett a jelenleg hozzáférhető nyelvi elemző eszközök „polcról levett” alkalmazásával kielégítő választ adni. A tanulmány azokat a megoldásokat és javaslatokat mutatja be, melyek hozzájárulnak ahhoz, hogy az olyan jelentős méretű korpuszokban is, ahol a manuális hibajavítás nem lehetséges, az annotáció minősége megfeleljen a felhasználói elvárásoknak.
Terjedelem/Fizikai jellemzők:109-121
ISBN:978-963-306-359-0