Chapters/chapter4.tex


1
2
3
4
5
6
7
8
9

\chapter{Co dalej}
RNN - sam wyciągnie kontekst

Na wersji sim-only - funkcja kosztu w zależności od odległości od trasy, może nagradzać szybkie przejazdy bo inaczej będzie stać w miejscu
Da się podciągnąć dla prawdziwej ale trzeba by jakoś użyć odo.

Reinforced learning - kara za każdą interwencję (może nie 0-1 tylko proporcjonalna od
róznicy outputów)