A duplakocka modell és az igei szerkezeteket kinyerő "ugrik és marad" módszer nyelvfüggetlensége, valamint néhány megjegyzés az UD annotáció univerzalitásáról
Jelen tanulmány egy módszernek a magyartól különböző nyelvekre való alkalmazhatóságát vizsgálja. A (Sass, 2019) tanulmány egy valódi igei szerkezetek kinyerésére szolgáló eljárást mutat be magyar nyelvre, és két állítást fogalmaz meg mellékesen: (1) a módszer tetszőleges nyelvre alkalmazható; (2) a...
Elmentve itt :
Szerző: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2020
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
16 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása, Korpusz - nyelvészet |
Online Access: | http://acta.bibl.u-szeged.hu/67654 |
LEADER | 02332naa a2200205 i 4500 | ||
---|---|---|---|
001 | acta67654 | ||
005 | 20221108114918.0 | ||
008 | 200505s2020 hu o 1|| zxx d | ||
020 | |a 978-963-306-719-2 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Sass Bálint | |
245 | 1 | 2 | |a A duplakocka modell és az igei szerkezeteket kinyerő "ugrik és marad" módszer nyelvfüggetlensége, valamint néhány megjegyzés az UD annotáció univerzalitásáról |h [elektronikus dokumentum] / |c Sass Bálint |
260 | |c 2020 | ||
300 | |a 399-407 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 16 | |
520 | 3 | |a Jelen tanulmány egy módszernek a magyartól különböző nyelvekre való alkalmazhatóságát vizsgálja. A (Sass, 2019) tanulmány egy valódi igei szerkezetek kinyerésére szolgáló eljárást mutat be magyar nyelvre, és két állítást fogalmaz meg mellékesen: (1) a módszer tetszőleges nyelvre alkalmazható; (2) a módszer alkalmazásához szükséges adatok függőségileg elemzett korpuszból könnyen származtathatók. E két állítást vesszük górcső alá. Adatként universal dependencies (UD) korpuszokat használunk fel. Az UD-nek köszönhetően annotációs különbségek elvileg nincsenek nincsenek a különféle nyelvű korpuszok között, csak a nettó nyelvi különbségek láthatók. Ezzel kapcsolatban gyakorlati megfigyeléseink alapján kritikát fogalmazunk meg. Bár az ige és közvetlen bővítményei közötti viszonyokat különböző nyelvek különböző eszközökkel fejezik ki, a vizsgált nyelvekre ezek a nyelvi eszközök néhány általános módon megragadhatók: esetrag, elöljáró/névutó (esetraggal vagy anélkül), szórend. Az említett eljárás működésének egyetlen feltétele az igék és közvetlen bővítményeik közötti viszonyok leírása, a fentiek alapján tehát működtethető az algoritmus. Eredményként valódi igei szerkezeket kapunk, azaz az eredmények igazolják sejtésünket, az eredeti cikk állításai megállják a helyüket. | |
695 | |a Nyelvészet - számítógép alkalmazása, Korpusz - nyelvészet | ||
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (16.) (2020) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/67654/1/msznykonf_016_399-407.pdf |z Dokumentum-elérés |