Többnyelvű dokumentum nyelvének megállapítása

A cikkben egy olyan algoritmust ismertetünk, amely alkalmas arra, hogy gyorsan és hatékonyan megállapítsa egy szövegrl nemcsak annak elsdleges természetes nyelvét, de többnyelv szöveg esetén a második nyelvet is – mindezt szótár nélkül egy módosított n-gram algoritmus segítségével. Az algoritmus jól...

Teljes leírás

Elmentve itt :
Bibliográfiai részletek
Szerzők: Pataki Máté
Vajna Miklós
Testületi szerző: Magyar Számítógépes Nyelvészeti Konferencia (8.) (2011) (Szeged)
Dokumentumtípus: Könyv része
Megjelent: 2011
Sorozat:Magyar Számítógépes Nyelvészeti Konferencia 8
Kulcsszavak:Nyelvészet - számítógép alkalmazása
Online Access:http://acta.bibl.u-szeged.hu/58784
Leíró adatok
Tartalmi kivonat:A cikkben egy olyan algoritmust ismertetünk, amely alkalmas arra, hogy gyorsan és hatékonyan megállapítsa egy szövegrl nemcsak annak elsdleges természetes nyelvét, de többnyelv szöveg esetén a második nyelvet is – mindezt szótár nélkül egy módosított n-gram algoritmus segítségével. Az algoritmus jól mködik vegyes nyelv, akár szótárként felépített, szavanként változó nyelv dokumentumokon is.
Terjedelem/Fizikai jellemzők:3-11
ISBN:978-963-306-121-3