Magyar nyelvű klinikai dokumentumok előfeldolgozása

A klinikai dokumentumok feldolgozásának első lépése azok strukturálása és normalizálása. Bemutatjuk, hogy a szerkezeti egységek hiányát hogyan tudtuk a formázási jegyek alapján automatikus transzformációkkal pótolni, illetve alapvető metainformációkat a folyó szövegből kinyerni. Ezután a korpusz szö...

Teljes leírás

Elmentve itt :

Bibliográfiai részletek
Szerzők:	Siklósi Borbála Orosz György Novák Attila
Testületi szerző:	Magyar Számítógépes Nyelvészeti Konferencia (8.) (2011) (Szeged)
Dokumentumtípus:	Könyv része
Megjelent:	2011
Sorozat:	Magyar Számítógépes Nyelvészeti Konferencia 8
Kulcsszavak:	Nyelvészet - számítógép alkalmazása
Online Access:	http://acta.bibl.u-szeged.hu/58797

Leíró adatok
Tartalmi kivonat:	A klinikai dokumentumok feldolgozásának első lépése azok strukturálása és normalizálása. Bemutatjuk, hogy a szerkezeti egységek hiányát hogyan tudtuk a formázási jegyek alapján automatikus transzformációkkal pótolni, illetve alapvető metainformációkat a folyó szövegből kinyerni. Ezután a korpusz szöveges részeit elválasztottuk a nem szöveges részektől, az így kapott halmazra automatikus helyesírás-javító, illetve javaslatgeneráló rendszert hoztunk létre. Módszerünk elsősorban a rendelkezésünkre álló korpusz statisztikai viselkedésére épül, de külső erőforrásokat is bevontunk a jobb minőség elérése végett. Az algoritmust két funkciója: a helyesírás-javítás, illetve a javaslatgenerálás alapján értékeltük ki. Beláttuk, hogy módszerünk a teljesen automatikus javításra pillanatnyilag önmagában nem alkalmas, azonban ez nem is volt cél, viszont minimális emberi közreműködéssel hatékonyan alkalmazható egy helyes orvosi-klinikai korpusz létrehozására.
Terjedelem/Fizikai jellemzők:	143-152
ISBN:	978-963-306-121-3

Magyar nyelvű klinikai dokumentumok előfeldolgozása

Hasonló tételek