summary refs log tree commit diff
path: root/Chapters/chapter4.tex
diff options
context:
space:
mode:
Diffstat (limited to 'Chapters/chapter4.tex')
-rw-r--r--Chapters/chapter4.tex19
1 files changed, 14 insertions, 5 deletions
diff --git a/Chapters/chapter4.tex b/Chapters/chapter4.tex
index 02adb80..b34809a 100644
--- a/Chapters/chapter4.tex
+++ b/Chapters/chapter4.tex
@@ -1,9 +1,18 @@
 \chapter{Co dalej}
-RNN - sam wyciągnie kontekst
+Najprostszym następnym krokiem jest zwiększenie danych o dodatkowy wymiar, i nauczenie takiej
+sieci decyzji na podstawie $k$ (niekoniecznie) ostatnich zdjęć. Innym prostym rozwiązaniem,
+które można z tym połączyć jest zmiana perspektywy kamery na zdjęcie z góry.
 
-Na wersji sim-only - funkcja kosztu w zależności od odległości od trasy, może nagradzać szybkie przejazdy bo inaczej będzie stać w miejscu
-Da się podciągnąć dla prawdziwej ale trzeba by jakoś użyć odo.
+Bardziej ambitnym pomysłem jest wytrenowanie rekurencyjnej sieci neuronowej (RNN),
+gdyby ją dobrze nauczyć sama wyciągnie kontekst. Ale problemem przy jej trenowaniu
+będzie fakt, że prostą strategią dla takiej sieci jest powtarzanie ostatniego wypisanego
+wyniku, a to dlatego że prędkość jest ciągła.
+
+Kolejnym rozwiązaniem jest reinforced learning, sieć karało by się za
+każdą interwencję lub wyjechanie poza trasę. Niestety problemem tutaj jest 
+fakt, że jak błąd prawdziwego pojazdu może być kosztowny lub niebezpieczny.
+
+Oczywiście pozostają też rozwiązania nie używające sieci neuronowych, można
+przykładowo stworzyć program pilnujący aby łazik nie wjechał w przeszkodę.
 
-Reinforced learning - kara za każdą interwencję (może nie 0-1 tylko proporcjonalna od
-róznicy outputów)