Magyar szövegek természetes nyelvi előfeldolgozása
A természetes nyelvi szövegek előfeldolgozásának feladata a szöveg mondatokra, szavakra bontása, tokenizálása (tokennek nevezzük a legkisebb önálló jelentéssel biró szövegegységet). Ehhez szorosan kapcsolódik az úgy nevezett nyílt tokenosztályokba tartozó egyes tokenek felismerése. Ezek olyan tokene...
Elmentve itt :
Szerzők: | |
---|---|
Testületi szerző: | |
Dokumentumtípus: | Könyv része |
Megjelent: |
2003
|
Sorozat: | Magyar Számítógépes Nyelvészeti Konferencia
1 |
Kulcsszavak: | Nyelvészet - számítógép alkalmazása |
Online Access: | http://acta.bibl.u-szeged.hu/59437 |
LEADER | 01503naa a2200217 i 4500 | ||
---|---|---|---|
001 | acta59437 | ||
005 | 20221108115121.0 | ||
008 | 190716s2003 hu o 1|| zxx d | ||
040 | |a SZTE Egyetemi Kiadványok Repozitórium |b hun | ||
041 | |a zxx | ||
100 | 1 | |a Miháczi András | |
245 | 1 | 0 | |a Magyar szövegek természetes nyelvi előfeldolgozása |h [elektronikus dokumentum] / |c Miháczi András |
260 | |c 2003 | ||
300 | |a 38-43 | ||
490 | 0 | |a Magyar Számítógépes Nyelvészeti Konferencia |v 1 | |
520 | 3 | |a A természetes nyelvi szövegek előfeldolgozásának feladata a szöveg mondatokra, szavakra bontása, tokenizálása (tokennek nevezzük a legkisebb önálló jelentéssel biró szövegegységet). Ehhez szorosan kapcsolódik az úgy nevezett nyílt tokenosztályokba tartozó egyes tokenek felismerése. Ezek olyan tokenek, amelyekben speciális (írásjelek vagy szóközök vannak. Az előfeldolgozás része a tulajdonnevek felismerése is, hiszen itt nagyméretű, tulajdonneveket tartalmazó, szótárakat kell használni A feladatok megoldására kipróbáltunk reguláris kifejezések alapján generált automatát, valamint döntésifa-tanuló algoritmusok által tanult szabályokat. | |
695 | |a Nyelvészet - számítógép alkalmazása | ||
700 | 0 | 1 | |a Németh László |e aut |
700 | 0 | 1 | |a Rácz Miklós |e aut |
710 | |a Magyar Számítógépes Nyelvészeti Konferencia (1.) (2003) (Szeged) | ||
856 | 4 | 0 | |u http://acta.bibl.u-szeged.hu/59437/1/msznykonf_001_038-043.pdf |z Dokumentum-elérés |