Igekötő-kapcsolás

Ahogy ebben a mondatban is látjuk, a magyarban az igekötő el tud válni az igéjétől. A korpuszok alapvető egysége a szó, a token, emiatt a magyar nyelvű korpuszokban hagyományosan mindig külön tokenként jelenik meg az elvált igekötő. Azt az alapvető információt tehát, hogy melyik igéhez tartozik az a...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Pethő Gergely
Sass Bálint
Kalivoda Ágnes
Simon László
Lipp Veronika
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (18.) (2022) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2022
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 18
Kulcsszavak:Nyelvészet - számítógép alkalmazása, Korpusz - nyelvészet, Lexikográfia, Igekötő
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/75866
Leíró adatok
Tartalmi kivonat:Ahogy ebben a mondatban is látjuk, a magyarban az igekötő el tud válni az igéjétől. A korpuszok alapvető egysége a szó, a token, emiatt a magyar nyelvű korpuszokban hagyományosan mindig külön tokenként jelenik meg az elvált igekötő. Azt az alapvető információt tehát, hogy melyik igéhez tartozik az adott igekötő, ezek a korpuszok nem tartalmazzák. Jelen tanulmányban egyrészt (1) módszert adunk az igekötők alapigéhez kapcsolására, másrészt (2) egy sémát arra, hogy ezt hogyan jelenítsük meg a korpusz annotációjában a korpuszban való keresést leginkább támogató módon. Az eszközt az e-magyar rendszer moduljaként implementáltuk, olyan funkcionalitást valósít meg, amelyre számos kutatásban merül fel igény. Az elkészült emPreverb modul és a kézzel annotált fejlesztő és tesztkorpuszok szabadon felhasználhatók.
Terjedelem/Fizikai jellemzők:77-91
ISBN:978-963-306-848-9