Diplomová práca

Téma: Škálovateľný proces získavania, extrakcie, deduplikácie a prezentácie webových dát
Vedúci práce: RNDr. Peter Gurský, PhD.

Ciele práce

1. Vytvorenie a nasadenie automatického procesu opakovaného
získavania, extrakcie, deduplikácie a prezentácie dát z internetových
obchodov s využitím príslušných nástrojov projektu Kapsa, realizujúcich príslušné operácie.

2. Realizácia výkonnostného testu a analýza úzkych miest nasadeného riešenia.

3. Návrh a realizácia škálovateľného distribuovaného spracovania odhalených úzkych miest
v rámci automatického procesu a jeho porovnanie s pôvodným riešením.