Téma: Škálovateľný proces získavania, extrakcie, deduplikácie a prezentácie webových dát
Vedúci práce: RNDr. Peter Gurský, PhD.
1. Vytvorenie a nasadenie automatického procesu opakovaného
získavania, extrakcie, deduplikácie a prezentácie dát z internetových
obchodov s využitím príslušných nástrojov projektu Kapsa, realizujúcich príslušné operácie.
2. Realizácia výkonnostného testu a analýza úzkych miest nasadeného riešenia.
3. Návrh a realizácia škálovateľného distribuovaného spracovania odhalených úzkych miest
v rámci automatického procesu a jeho porovnanie s pôvodným riešením.
Prezentácia PDSI: pptx formát
Rozšírené zadanie: pdf formát