Főnévi csoportok tanulása és felismerése
A dolgozat azt tanulmányozza, hogy főnévi szerkezetek felismerése milyen részproblémákra bontható, illetve, hogy az egyes részproblémákban, milyen elemzések, teszteredmények segítenek bennünket a továbblépésben a lehető legjobb minőségű megoldás felé. A számos megközelítési lehetőség közül mi a szab...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2003
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
1 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/59429 |
LEADER | 01985naa a2200205 i 4500 | ||
---|---|---|---|
001 | acta59429 | ||
005 | 20221108115117.0 | ||
008 | 190715s2003 hu o 1|| zxx d | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Hócza András | |
245 | 1 | 0 | |a Főnévi csoportok tanulása és felismerése |h [elektronikus dokumentum] / |c Hócza András |
260 | |c 2003 | ||
300 | |a 72-77 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 1 | |
520 | 3 | |a A dolgozat azt tanulmányozza, hogy főnévi szerkezetek felismerése milyen részproblémákra bontható, illetve, hogy az egyes részproblémákban, milyen elemzések, teszteredmények segítenek bennünket a továbblépésben a lehető legjobb minőségű megoldás felé. A számos megközelítési lehetőség közül mi a szabály alapú módszereket választottuk, de ez is felvet számos specifikus részproblémát. Két tanuló algoritmust alkalmaztunk szabályok előállítására. Az egyik a közismert C4.5, a másik egy saját fejlesztésű algoritmus, az RGLearn. A teszteket egy erre a célra kifejlesztett NP elemzővel végeztük. A kísérleteket és a különféle teszteket jelentős mértékben segítette a körülbelül 1,2 millió szót tartalmazó, kézzel annotált Szeged Korpusz [1], amely különböző (iskolai, szépirodalomi, számítógépes, jogi, üzleti) szövegtípusokra tartalmazza a nyelvészeti szakértők által bejelölt főnévi csoportokat. Az NP felismerésre kifejlesztett elemzőnk, szakértői szabályokkal 65%-os, környezetfüggetlen szabályokkal 85%-os, kömyezetfüggő szabályokkal 90%-os pontossággal építette fel tesztállományban található NP szerkezeteket. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 1 | |a Iván Szabolcs |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/59429/1/msznykonf_001_072-077.pdf |z Dokumentum-elérés |