HunSum-1 an abstractive summarization dataset for Hungarian /

We introduce HunSum-1 : a dataset for Hungarian abstractive summarization, consisting of 1.14M news articles. The dataset is built by collecting, cleaning and deduplicating data from 9 major Hungarian news sites through CommonCrawl. Using this dataset, we build abstractive summarizer models based on...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Barta Botond
Lakatos Dorina
Nagy Attila
Nyist Milán Konor
Ács Judit
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (19.)
Dokumentumtípus: Könyv része
Megjelent: 2023
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 19
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/78416
LEADER 01566naa a2200277 i 4500
001 acta78416
005 20230316084906.0
008 230316s2023 hu o 1|| eng d
020 |a 978-963-306-912-7 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a eng 
100 1 |a Barta Botond 
245 1 0 |a HunSum-1   |h [elektronikus dokumentum] :  |b an abstractive summarization dataset for Hungarian /  |c  Barta Botond 
260 |c 2023 
300 |a 231-243 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 19 
520 3 |a We introduce HunSum-1 : a dataset for Hungarian abstractive summarization, consisting of 1.14M news articles. The dataset is built by collecting, cleaning and deduplicating data from 9 major Hungarian news sites through CommonCrawl. Using this dataset, we build abstractive summarizer models based on huBERT and mT5. We demonstrate the value of the created dataset by performing a quantitative and qualitative analysis on the models’ results. The HunSum-1 dataset, all models used in our experiments and our code1 are available open source. 
650 4 |a Természettudományok 
650 4 |a Számítás- és információtudomány 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Lakatos Dorina  |e aut 
700 0 1 |a Nagy Attila  |e aut 
700 0 1 |a Nyist Milán Konor  |e aut 
700 0 1 |a Ács Judit  |e aut 
711 |a Magyar számítógépes nyelvészeti konferencia (19.)  |c Szeged  |d 2023. január 26-27. 
856 4 0 |u http://acta.bibl.u-szeged.hu/78416/1/msznykonf_019_231-243..pdf  |z Dokumentum-elérés