HunSum-1 an abstractive summarization dataset for Hungarian /

We introduce HunSum-1 : a dataset for Hungarian abstractive summarization, consisting of 1.14M news articles. The dataset is built by collecting, cleaning and deduplicating data from 9 major Hungarian news sites through CommonCrawl. Using this dataset, we build abstractive summarizer models based on...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Barta Botond
Lakatos Dorina
Nagy Attila
Nyist Milán Konor
Ács Judit
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (19.)
Dokumentumtípus: Könyv része
Megjelent: 2023
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 19
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/78416

Hasonló tételek