Az origo automatikus címkézési projekt tapasztalatai

A cikkben bemutatjuk az [origo] hírportál archívumának automatikus címkézésére irányuló projektet. Címkézés alatt azt az eljárását értjük, ami az egyes dokumentumokhoz egy olyan kifejezéshalmazt rendel, amely annak tartalmát jól reprezentálja. A cikkben bemutatásra kerülnek az újságarchívumok címkéz...

Full description

Saved in:
Bibliographic Details
Main Author: Farkas Richárd
Corporate Author: Magyar Számítógépes Nyelvészeti Konferencia (6.) (2009) (Szeged)
Format: Article
Published: 2009
Series:Magyar Számítógépes Nyelvészeti Konferencia 6
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58699
Description
Summary:A cikkben bemutatjuk az [origo] hírportál archívumának automatikus címkézésére irányuló projektet. Címkézés alatt azt az eljárását értjük, ami az egyes dokumentumokhoz egy olyan kifejezéshalmazt rendel, amely annak tartalmát jól reprezentálja. A cikkben bemutatásra kerülnek az újságarchívumok címkézésére vonatkozó irányelvek, az automatikus címkézési megoldásunk, az elért eredmények és tárgyalunk olyan nyitott számítógépes nyelvészeti problémákat, amelyek megoldása nagyban hozzájárulhat a címkézés sikerességéhez. Az [origo] archívumának automatikus címkézése manuális kiértékelés alapján a dokumentumok 77,5 százalékát megfelelnek minsítette, ami meghaladta az eredeti célkitűzéseket.
Physical Description:84-92
ISBN:978-963-482-982-9