emLam - a Hungarian Language Modeling baseline
This paper aims to make up for the lack of documented baselines for Hungarian language modeling. Various approaches are evaluated on three publicly available Hungarian corpora. Perplexity values comparable to models of similar-sized English corpora are reported. A new, freely downloadable Hungarian...
Elmentve itt :
Szerző: | Nemeskey Dávid Márk |
---|---|
Testületi szerző: | Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged) |
Dokumentumtípus: | Könyv része |
Megjelent: |
2017
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
13 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/59000 |
Hasonló tételek
-
Egy emBERT próbáló feladat
Szerző: Nemeskey Dávid Márk
Megjelent: (2020) -
Evaluating contextualized language models for Hungarian
Szerző: Ács Judit, et al.
Megjelent: (2021) -
Egy privát EM algoritmus
Szerző: Kelemen Márk
Megjelent: (2018) -
emToken Unicode-képes tokenizáló magyar nyelvre /
Szerző: Mittelholcz Iván
Megjelent: (2017) -
Pronunciation variation modeling of Hungarian language for CSR
Szerző: Szaszák György, et al.
Megjelent: (2003)