01821naa a2200217 i 4500 acta58884 20260224081030.0 190627s2014 hu o 100 hun d 978-963-306-246-3 SZTE Egyetemi Kiadványok Repozitórium hun hun Siklósi Borbála A magyar beteg [elektronikus dokumentum] / Siklósi Borbála 2014 188-198 Magyar Számítógépes Nyelvészeti Konferencia 10 A klinikai szövegek feldolgozása aktív kutatási terület, melynek során az egyik legnagyobb kihívás az ilyen szövegek azon sajátosságainak a kezelése, amelyek tekintetében ezek az általános szövegektől jelentősen eltérnek. Ezek között szerepel többek között a sok szakszó és rövidítés, a szinte csak rövidítésekből és numerikus adatokból álló „mondatok”, valamint a jelentős számú helyesírási és központozási hiba, amelyből többek között a mondathatárok felismerésének rendkívül nehéz volta is következik. Cikkünkben bemutatjuk a rendelkezésünkre álló magyar klinikai korpusz jellemzőit, különös tekintettel az előbb említett tényezőkre, összevetve azt egy általános tartalmú magyar szövegeket tartalmazó korpusszal. A szövegek felszíni tulajdonságai mellett összehasonlításokat végeztünk a leggyakoribb szavak disztribúciós szemantikai viselkedése alapján is, melynek során a jelentésbeli különbségek is kimutathatóak a különböző korpuszok között. Nyelvészet - számítógép alkalmazása Novák Attila aut Magyar Számítógépes Nyelvészeti Konferencia (10.) (2014) (Szeged) http://acta.bibl.u-szeged.hu/58884/1/msznykonf_010_188-198.pdf Dokumentum-elérés