emLam - a Hungarian Language Modeling baseline

This paper aims to make up for the lack of documented baselines for Hungarian language modeling. Various approaches are evaluated on three publicly available Hungarian corpora. Perplexity values comparable to models of similar-sized English corpora are reported. A new, freely downloadable Hungarian...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerző: Nemeskey Dávid Márk
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2017
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 13
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/59000
LEADER 01091naa a2200205 i 4500
001 acta59000
005 20221108114930.0
008 190701s2017 hu o 1|| zxx d
020 |a 978-963-306-518-1 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a zxx 
100 1 |a Nemeskey Dávid Márk 
245 1 0 |a emLam - a Hungarian Language Modeling baseline  |h [elektronikus dokumentum] /  |c  Nemeskey Dávid Márk 
260 |c 2017 
300 |a 91-102 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 13 
520 3 |a This paper aims to make up for the lack of documented baselines for Hungarian language modeling. Various approaches are evaluated on three publicly available Hungarian corpora. Perplexity values comparable to models of similar-sized English corpora are reported. A new, freely downloadable Hungarian benchmark corpus is introduced. 
695 |a Nyelvészet - számítógép alkalmazása 
710 |a Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged) 
856 4 0 |u http://acta.bibl.u-szeged.hu/59000/1/klskla.pdf  |z Dokumentum-elérés