Adaptabilné aktivačné funkcie pomocou splajnovej interpolácie

Autor práce: Tara Stefányi
Vedúci práce: RNDr. Viliam Kačala

Ciele práce

  • implementácia interpolačných a aproximačných splajnov typu C$^1$ aj C$^2$
  • návrh a implementácia neurónových sietí so splajnovou aktivačnou funkciou
  • porovnanie splajnov ako aproximátorov aktivačnej funkcie

Čo je splajn

  • spojitá hladká polynomická funkcia
  • definovaná po častiach
  • interpolačné a aproximačné

Neurónová sieť

Rozšírené učenie

  • zlepšenie presnosti
  • úprava aktivačnej funkcie
  • nepraktická globálna úprava

Výber splajnu

  • B-splajn
  • Catmull-Rom splajn
  • Hermitov splajn + de Boor

Testovanie siete

  • iteratívny prístup
  • rovnaké inicializačné váhy
  • prevencia proti náhodným správnym výsledkom

Výsledky

STD C$^1$ C$^2$
ÚSPEŠNOSŤ 100% 91,7% 92%
CHYBA ✓ 3.94 1.29 1.61 ×10$^{-3}$
CHYBA × 0 0.24 0.21
VZORKY 50 43 30

Výsledky

STD C$^1$ C$^2$
ÚSPEŠNOSŤ 100% 100% 100%
CHYBA ✓ 2.60 1.38 1.50 ×10$^{-2}$
CHYBA × 0 0 0
EPOCHY 1685 740 850

Ďakujem za pozornosť

Otázky?

Použitie splajnových aktivačných funkcií zníži potrebný počet iterácií učenia zhruba na polovicu. Splajny sú však náročnejšie na výpočet ako štandardné aktivačné funkcie. Aký to má vplyv na výsledný čas učenia?
‭ ‭
STD C$^1$ C$^2$
EPOCHY 1661 718 828
ČAS TRÉNOVANIA 803.34106.3 4730.2 ms
ČAS NA EPOCHU 0.485.72‬ 5.71 ms
V práci uvažujete interpolačné splajny typu C$^1$ aj C$^2$. Vedeli by ste sa vyjadriť aj k aproximačným splajnom typu C$^2$, napr. B – splajnom?
Hermitov splajn = spojenie výhod interpolačných a aproximačných splajnov