Az origo automatikus címkézési projekt tapasztalatai

A cikkben bemutatjuk az [origo] hírportál archívumának automatikus címkézésére irányuló projektet. Címkézés alatt azt az eljárását értjük, ami az egyes dokumentumokhoz egy olyan kifejezéshalmazt rendel, amely annak tartalmát jól reprezentálja. A cikkben bemutatásra kerülnek az újságarchívumok címkéz...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerző: Farkas Richárd
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (6.) (2009) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2009
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 6
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58699
Leíró adatok
Tartalmi kivonat:A cikkben bemutatjuk az [origo] hírportál archívumának automatikus címkézésére irányuló projektet. Címkézés alatt azt az eljárását értjük, ami az egyes dokumentumokhoz egy olyan kifejezéshalmazt rendel, amely annak tartalmát jól reprezentálja. A cikkben bemutatásra kerülnek az újságarchívumok címkézésére vonatkozó irányelvek, az automatikus címkézési megoldásunk, az elért eredmények és tárgyalunk olyan nyitott számítógépes nyelvészeti problémákat, amelyek megoldása nagyban hozzájárulhat a címkézés sikerességéhez. Az [origo] archívumának automatikus címkézése manuális kiértékelés alapján a dokumentumok 77,5 százalékát megfelelnek minsítette, ami meghaladta az eredeti célkitűzéseket.
Terjedelem/Fizikai jellemzők:84-92
ISBN:978-963-482-982-9