emToken Unicode-képes tokenizáló magyar nyelvre /
Cikkünkben az emToken tokenizáló programot mutatjuk be. Ennek főbb tulajdonságai között említhető, a széleskörű UTF-8 támogatás, a konfigurálhatóság, az automatikus tesztkörnyezet és a programkönytár által nyújtott API. Az előállított - XML vagy JSON formátumú - kimenet detokenizálható. A program fo...
Elmentve itt :
Szerző: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2017
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
13 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/58997 |
LEADER | 01227naa a2200205 i 4500 | ||
---|---|---|---|
001 | acta58997 | ||
005 | 20221108114930.0 | ||
008 | 190701s2017 hu o 1|| zxx d | ||
020 | |a 978-963-306-518-1 | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Mittelholcz Iván | |
245 | 1 | 0 | |a emToken |h [elektronikus dokumentum] : |b Unicode-képes tokenizáló magyar nyelvre / |c Mittelholcz Iván |
260 | |c 2017 | ||
300 | |a 61-69 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 13 | |
520 | 3 | |a Cikkünkben az emToken tokenizáló programot mutatjuk be. Ennek főbb tulajdonságai között említhető, a széleskörű UTF-8 támogatás, a konfigurálhatóság, az automatikus tesztkörnyezet és a programkönytár által nyújtott API. Az előállított - XML vagy JSON formátumú - kimenet detokenizálható. A program forráskódja szabadon elérhető GPLv3 licenc alatt. Az emToken az e-magyar eszközlánc tokenizálásért felelős modulja. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (13.) (2017) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/58997/1/msznykonf_013_061-069.pdf |z Dokumentum-elérés |