Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál
Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2005
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
3 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/58603 |
LEADER | 01679naa a2200229 i 4500 | ||
---|---|---|---|
001 | acta58603 | ||
005 | 20221108115102.0 | ||
008 | 190617s2005 hu o 1|| zxx d | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Tikk Domonkos | |
245 | 1 | 0 | |a Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál |h [elektronikus dokumentum] / |c Tikk Domonkos |
260 | |c 2005 | ||
300 | |a 430-434 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 3 | |
520 | 3 | |a Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező és a szótár mérete között. Másrészt az egyik szövegbányászati alapfeladat, az osztályozás esetén azt tanulmányozzuk, hogy az egyes szótövezők alkalmazása milyen minőségi következménnyel jár. A vizsgálat során a HunStem szótövezőt, a szópárlista alapú szótövezőt, és egy általunk javasolt ún. óvatos szótövező eljárást hasonlítunk össze. Tesztjeink során a HITEC automatikus osztályozó programcsomagot használtuk. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 1 | |a Törcsvári Attila |e aut |
700 | 0 | 1 | |a Biró György |e aut |
700 | 0 | 1 | |a Bánsághi Zoltán |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/58603/1/msznykonf_003_430-434.pdf |z Dokumentum-elérés |