A new ParlaMint corpus for Hungarian 30m tokens of annotated parliamentary data

Parliamentary data constitute a rich source for research for academic fields in the social sciences and humanities (SSH). To facilitate such research, comparable, high-quality parliamentary corpora are needed. The ParlaMint project, funded by CLARIN-ERIC, aims to create such corpora for languages sp...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Ligeti-Nagy Noémi
Dodé Réka
Jelencsik-Mátyus Kinga
Varga Zsófia
Héja Enikő
Váradi Tamás
Testületi szerző: Magyar számítógépes nyelvészeti konferencia (19.)
Dokumentumtípus: Könyv része
Megjelent: 2023
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 19
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Tárgyszavak:
Online Access:http://acta.bibl.u-szeged.hu/78431
LEADER 02223naa a2200313 i 4500
001 acta78431
005 20230316112828.0
008 230316s2023 hu o 1|| eng d
020 |a 978-963-306-912-7 
040 |a SZTE Egyetemi Kiadványok Repozitórium  |b hun 
041 |a eng 
100 2 |a Ligeti-Nagy Noémi 
245 1 2 |a A new ParlaMint corpus for Hungarian 30m tokens of annotated parliamentary data  |h [elektronikus dokumentum] /  |c  Ligeti-Nagy Noémi 
260 |c 2023 
300 |a 433-446 
490 0 |a Magyar Számítógépes Nyelvészeti Konferencia  |v 19 
520 3 |a Parliamentary data constitute a rich source for research for academic fields in the social sciences and humanities (SSH). To facilitate such research, comparable, high-quality parliamentary corpora are needed. The ParlaMint project, funded by CLARIN-ERIC, aims to create such corpora for languages spoken in European parliaments in a shared framework consisting of uniform encoding schemas, metadata structure, and Universal Dependencies-type linguistic annotation. The newly built Hungarian corpus of ParlaMint II focuses on the minutes of the Hungarian National Assembly between May 2014 and June 2022 and can be considered a major improvement from the Hungarian corpus of ParlaMint I. It has a wider time frame, more extensive metadata on speakers and their affiliations, and more sophisticated linguistic analysis than what was available in ParlaMint I. The Hungarian ParlaMint II corpus is openly available, just as all the ParlaMint corpora for other languages. Some potential applications of ParlaMint corpora in SSH research are also discussed. 
650 4 |a Természettudományok 
650 4 |a Számítás- és információtudomány 
650 4 |a Bölcsészettudományok 
650 4 |a Nyelvek és irodalom 
695 |a Nyelvészet - számítógép alkalmazása 
700 0 1 |a Dodé Réka  |e aut 
700 0 2 |a Jelencsik-Mátyus Kinga  |e aut 
700 0 2 |a Varga Zsófia  |e aut 
700 0 2 |a Héja Enikő  |e aut 
700 0 2 |a Váradi Tamás  |e aut 
711 |a Magyar számítógépes nyelvészeti konferencia (19.)  |c Szeged  |d 2023. január 26-27. 
856 4 0 |u http://acta.bibl.u-szeged.hu/78431/1/msznykonf_019_433-446..pdf  |z Dokumentum-elérés