blob: 02adb80bff3976335283e49e7e07fd93b1684bfd (
plain) (
tree)
|
|
\chapter{Co dalej}
RNN - sam wyciągnie kontekst
Na wersji sim-only - funkcja kosztu w zależności od odległości od trasy, może nagradzać szybkie przejazdy bo inaczej będzie stać w miejscu
Da się podciągnąć dla prawdziwej ale trzeba by jakoś użyć odo.
Reinforced learning - kara za każdą interwencję (może nie 0-1 tylko proporcjonalna od
róznicy outputów)
|