summary refs log tree commit diff
path: root/Chapters/chapter4.tex
blob: 02adb80bff3976335283e49e7e07fd93b1684bfd (plain) (blame)
1
2
3
4
5
6
7
8
9
\chapter{Co dalej}
RNN - sam wyciągnie kontekst

Na wersji sim-only - funkcja kosztu w zależności od odległości od trasy, może nagradzać szybkie przejazdy bo inaczej będzie stać w miejscu
Da się podciągnąć dla prawdziwej ale trzeba by jakoś użyć odo.

Reinforced learning - kara za każdą interwencję (może nie 0-1 tylko proporcjonalna od
róznicy outputów)