Utilizing word embeddings for part-of-speech tagging
In this paper, we illustrate the power of distributed word representations for the part-of-speech tagging of Hungarian texts. We trained CRF models for POS-tagging that made use of features derived from the sparse coding of the word embeddings of Hungarian words as signals. We show that relying on s...
Elmentve itt :
Szerző: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2016
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
12 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/58962 |
LEADER | 01378naa a2200205 i 4500 | ||
---|---|---|---|
001 | acta58962 | ||
005 | 20221108114933.0 | ||
008 | 190701s2016 hu o 1|| zxx d | ||
020 | |a 978-963-306-450-4 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Berend Gábor | |
245 | 1 | 0 | |a Utilizing word embeddings for part-of-speech tagging |h [elektronikus dokumentum] / |c Berend Gábor |
260 | |c 2016 | ||
300 | |a 59-67 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 12 | |
520 | 3 | |a In this paper, we illustrate the power of distributed word representations for the part-of-speech tagging of Hungarian texts. We trained CRF models for POS-tagging that made use of features derived from the sparse coding of the word embeddings of Hungarian words as signals. We show that relying on such a representation, it is possible to avoid the creation of language specific features for achieving reliable performance. We evaluated our models on all the subsections of the Szeged Treebank both using MSD and universal morphology tag sets. Furthermore, we also report results for inter-subcorpora experiments. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (12.) (2016) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/58962/1/msznykonf_012_059-067.pdf |z Dokumentum-elérés |