Diplomová práca

Téma: Získavanie atribútov objektov z ich popisu

Vedúci práce: RNDr. Peter Gurský, PhD.

Autor práce: Michaela Linková



Ciele práce:

  1. Návrh metód na extrakciu rôznych atribútov z voľného textu s využitím aktuálnych nástrojov na prácu s prirodzeným jazykom.
  2. Implementácia navrhnutých metód.
  3. Vytvorenie dostatočnej dátovej sady na overenie vytvorených metód.
  4. Testovanie a analýza korektnosti a úplnosti vytvorených metód.
  5. Analýza prípadov, v ktorých navrhnuté metódy zlyhávajú.


Odporúčaná študijná literatúra:

  1. J. NothMan at al.: Learning multilingual named entity recognition from Wikipedia. Artificial Intelligence 194 (2013) 151–175
  2. odkaz na literatúru
  3. D. Nadeau, S. Sekine, A survey of named entity recognition and classification, Lingvisticae Investigationes 30 (2007) 3–26
  4. D. M. Bikel et al.: Nymble: a High-Performance Learning Name-finder. In ANLP-97, Washington, D.C., pp. 194 – 201, 1997.
  5. J. M. Castillo et al.: Named Entity Recognition Using Support Vector Machine for Filipino Text Documents. International Journal of Future Computer and Communication, Vol. 2, No. 5, October 2013
  6. odkaz na literatúru
  7. K. Frantzi, S. Ananiadou, J. Tsujii: The C-value/NC-value Method of Automatic Recognition of Multi-word Terms. In proceedings of ECDL, pp. 585-604. ISBN 3-540-65101-2, 1998
  8. Jana Hiľovská: Syntaktická analýza slovenskej vety pomocou Tvaroslovníka. Diplomová práca PF UPJŠ 2017


Plán práce:

  1. Vytvorenie webového rozhrania na získanie datovej sady.
  2. Návrh metód pre extrakciu.
  3. Implementácia a analýza navrhnutých metód.


Kontakt:

  • E-mail:michaela.linkova@student.upjs.sk