<?xml version="1.0" encoding="UTF-8"?>
<collection xmlns="http://www.loc.gov/MARC21/slim">
 <record>
  <leader>01821naa a2200217 i 4500</leader>
  <controlfield tag="001">acta58884</controlfield>
  <controlfield tag="005">20260224081030.0</controlfield>
  <controlfield tag="008">190627s2014    hu      o     100   hun d</controlfield>
  <datafield tag="020" ind1=" " ind2=" ">
   <subfield code="a">978-963-306-246-3</subfield>
  </datafield>
  <datafield tag="040" ind1=" " ind2=" ">
   <subfield code="a">SZTE Egyetemi Kiadványok Repozitórium</subfield>
   <subfield code="b">hun</subfield>
  </datafield>
  <datafield tag="041" ind1=" " ind2=" ">
   <subfield code="a">hun</subfield>
  </datafield>
  <datafield tag="100" ind1="1" ind2=" ">
   <subfield code="a">Siklósi Borbála</subfield>
  </datafield>
  <datafield tag="245" ind1="1" ind2="2">
   <subfield code="a">A magyar beteg</subfield>
   <subfield code="h">[elektronikus dokumentum] /</subfield>
   <subfield code="c"> Siklósi Borbála</subfield>
  </datafield>
  <datafield tag="260" ind1=" " ind2=" ">
   <subfield code="c">2014</subfield>
  </datafield>
  <datafield tag="300" ind1=" " ind2=" ">
   <subfield code="a">188-198</subfield>
  </datafield>
  <datafield tag="490" ind1="0" ind2=" ">
   <subfield code="a">Magyar Számítógépes Nyelvészeti Konferencia</subfield>
   <subfield code="v">10</subfield>
  </datafield>
  <datafield tag="520" ind1="3" ind2=" ">
   <subfield code="a">A klinikai szövegek feldolgozása aktív kutatási terület, melynek során az egyik legnagyobb kihívás az ilyen szövegek azon sajátosságainak a kezelése, amelyek tekintetében ezek az általános szövegektől jelentősen eltérnek. Ezek között szerepel többek között a sok szakszó és rövidítés, a szinte csak rövidítésekből és numerikus adatokból álló „mondatok”, valamint a jelentős számú helyesírási és központozási hiba, amelyből többek között a mondathatárok felismerésének rendkívül nehéz volta is következik. Cikkünkben bemutatjuk a rendelkezésünkre álló magyar klinikai korpusz jellemzőit, különös tekintettel az előbb említett tényezőkre, összevetve azt egy általános tartalmú magyar szövegeket tartalmazó korpusszal. A szövegek felszíni tulajdonságai mellett összehasonlításokat végeztünk a leggyakoribb szavak disztribúciós szemantikai viselkedése alapján is, melynek során a jelentésbeli különbségek is kimutathatóak a különböző korpuszok között.</subfield>
  </datafield>
  <datafield tag="695" ind1=" " ind2=" ">
   <subfield code="a">Nyelvészet - számítógép alkalmazása</subfield>
  </datafield>
  <datafield tag="700" ind1="0" ind2="1">
   <subfield code="a">Novák Attila</subfield>
   <subfield code="e">aut</subfield>
  </datafield>
  <datafield tag="710" ind1=" " ind2=" ">
   <subfield code="a">Magyar Számítógépes Nyelvészeti Konferencia (10.) (2014) (Szeged)</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2="0">
   <subfield code="u">http://acta.bibl.u-szeged.hu/58884/1/msznykonf_010_188-198.pdf</subfield>
   <subfield code="z">Dokumentum-elérés </subfield>
  </datafield>
 </record>
</collection>
