Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál

Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Tikk Domonkos
Törcsvári Attila
Biró György
Bánsághi Zoltán
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2005
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 3
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58603
LEADER 01679naa a2200229 i 4500
001 acta58603
005 20221108115102.0
008 190617s2005 hu o 1|| zxx d
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Tikk Domonkos 
245 1 0 |a Szótövező eljárások hatása magyar szövegek automatikus kategorizálásánál  |h [elektronikus dokumentum] /  |c  Tikk Domonkos 
260 |c 2005 
300 |a 430-434 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 3 
520 3 |a Cikkünkben a szövegbányászat területén jellemzően alkalmazott vektortér-modell reprezentáció egyik fontos kérdését, a dimenzióredukciót tárgyaljuk. Ezen belül különböző szótövező eljárások hatását vizsgáljuk több szempontból. Egyrészt azt tekintjük át, milyen összefüggés van az alkalmazott szótövező és a szótár mérete között. Másrészt az egyik szövegbányászati alapfeladat, az osztályozás esetén azt tanulmányozzuk, hogy az egyes szótövezők alkalmazása milyen minőségi következménnyel jár. A vizsgálat során a HunStem szótövezőt, a szópárlista alapú szótövezőt, és egy általunk javasolt ún. óvatos szótövező eljárást hasonlítunk össze. Tesztjeink során a HITEC automatikus osztályozó programcsomagot használtuk. 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Törcsvári Attila  |e aut 
700 0 1 |a Biró György  |e aut 
700 0 1 |a Bánsághi Zoltán  |e aut 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (3.) (2005) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/58603/1/msznykonf_003_430-434.pdf  |z Dokumentum-elérés