summary refs log tree commit diff
path: root/Chapters/chapter3.tex
diff options
context:
space:
mode:
authorPaweł Dybiec <pawel.to.malpa@gmail.com>2018-02-12 16:09:25 +0100
committerPaweł Dybiec <pawel.to.malpa@gmail.com>2018-02-12 16:09:25 +0100
commit2b8c08fd2b2af81be7b3cd1eed031b5bfdeee09b (patch)
tree7730d22b7dcf77fe8f92eb024c755a2663a41163 /Chapters/chapter3.tex
parentwiecej tekstu, blisko final (diff)
głównie poprawki stylistyczne
Diffstat (limited to 'Chapters/chapter3.tex')
-rw-r--r--Chapters/chapter3.tex58
1 files changed, 29 insertions, 29 deletions
diff --git a/Chapters/chapter3.tex b/Chapters/chapter3.tex
index e18e293..8991a9a 100644
--- a/Chapters/chapter3.tex
+++ b/Chapters/chapter3.tex
@@ -1,86 +1,86 @@
 \chapter{Wyniki sieci}
-Wytrenowana sieć potrafi przejechać zarówno cały tor na symulatorze jak i
-podziemny garaż instytutu. Na dodatek sieć trenowana pod symulator uczyła się,
-tylko jeździć przeciwnie do ruchu wskazówek zegara, a po ustawieniu modelu w przeciwnym
-kierunku potrafi przejechać cały tor bezproblemowo.
+Wytrenowana sieć potrafi przejechać zarówno cały tor na symulatorze, jak i
+podziemny garaż instytutu. Na dodatek sieć trenowana pod symulator uczyła się
+ jeździć tylko przeciwnie do ruchu wskazówek zegara. Po ustawieniu modelu w przeciwnym
+kierunku, sieć potrafi bezproblemowo przejechać cały tor.
 
 \section{Na co zwraca uwagę}
 Aktywność sieci dla obrazków została wygenerowana za pomocą metody
 Integrated Gradients\footnote{\href{https://arxiv.org/abs/1703.01365}{https://arxiv.org/abs/1703.01365}}.
 
-Co było oczywiste w przypadku symulatora,sieć zwraca głównie uwagę na miejsca,
-gdzie pojawiają się granice drogi\ref{sim_act}. Co ciekawe reaguje też na ścianę
+Co było oczywiste w przypadku symulatora, sieć zwraca głównie uwagę na miejsca,
+gdzie pojawiają się granice drogi \ref{sim_act}. Co ciekawe, reaguje też na ścianę
 tworzącą horyzont, ponieważ zmienia wygląd w zależności od odległości i może
-pomóc w orientacji (na tej trasie).
+pomóc w orientacji (na trasie treningowej).
 \begin{figure}
   \centering
   \fbox{
   \scalebox{0.5}{\includegraphics{img/sim_img.png}}
   }
-  \label{sim_img}
   \caption{Obraz z symulatora}
+  \label{sim_img}
 \end{figure}
 \begin{figure}
   \centering
   \fbox{
   \scalebox{0.5}{\includegraphics{img/sim_img_act.png}}
   }
-  \label{sim_act}
   \caption{Na co sieć patrzy, symulator}
+  \label{sim_act}
 \end{figure}
 \begin{figure}
   \centering
   \fbox{
   \scalebox{0.5}{\includegraphics{img/real_img.png}}
   }
-  \label{real_img}
   \caption{Obraz z nagrania}
+  \label{real_img}
 \end{figure}
 \begin{figure}
   \centering
   \fbox{
     \scalebox{0.5}{\includegraphics{img/real_img_act.png}}
   }
-  \label{real_act}
   \caption{Na co sieć patrzy, nagranie}
+  \label{real_act}
 \end{figure}
 
-Z kolei dla łazika intensywność w najbardziej aktywnym miejscu jest dużo mniejsza,
-co oznacza że nie sugeruje się tylko jednym miejscem. Ale mimo tego najbardziej 
-zwraca uwagę na kratkę na podłodze, która mogła by wystarczyć do nawigacji.
+Z kolei dla łazika intensywność w najbardziej aktywnym miejscu jest dużo mniejsza \ref{real_act}.
+Oznacza to, że nie sugeruje się tylko jednym obszarem z kamery. Najbardziej jednak 
+zwraca uwagę na kratkę na podłodze, która mogłaby wystarczyć do nawigacji.
 
 \section{W porównaniu do nagrania}
-Na wykresie \ref{plot_ang} widać że sieć (pomarańczowy kolor), mniej gwałtownie 
-zmienia szybkość obrotu niż kierowca (kolor niebieski). Ale w podobnych momentach
-zauważa, że należy skręcić.
+Na wykresie \ref{plot_ang} widać, że sieć (pomarańczowy kolor) mniej gwałtownie 
+zmienia szybkość obrotu niż kierowca (kolor niebieski). Jednak sieć reaguje w podobnych momentach co kierowca na konieczność wykonania skrętu.
+
 \begin{figure}
   \centering
   \fbox{
     \scalebox{0.5}{\includegraphics{img/real_data_ang.png}}
   }
-  \label{plot_ang}
   \caption{Prędkość obrotowa: sieć vs kierowca}
+  \label{plot_ang}
 \end{figure}
 
 \section{Wpływ architektury}
 W przypadku sieci pod symulator, usunięcie niektórych warstw konwolucyjnych
-pozwalało modelowi utrzymać się na torze, a taka sama zredukowana architektura 
-nie radziła sobie dobrze w przypadku nagrań z prawdziwego łazika. Natomiast
-usunięcie nieliniowości z warstw konwolucyjnych tak okaleczyła zdolności sieci,
+pozwalało modelowi nadal utrzymywać się na torze, natomiast taka sama zredukowana architektura 
+nie radziła sobie dobrze w przypadku nagrań z prawdziwego łazika. Z kolei
+usunięcie nieliniowości z warstw konwolucyjnych ograniczyło zdolności sieci do takiego stopnia,
 że nie potrafiła się utrzymać na wirtualnym torze.
 
-Z kolei usunięcie dropoutu, bardzo szybko powodowało overfitting i radziła sobie
+Usunięcie dropoutu bardzo szybko powodowało overfitting i sieć radziła sobie
 dobrze tylko na danych uczących. Z kolei dodanie warstw liniowych na końcu nie 
 poprawiało, ani nie pogorszało zbytnio wydajności sieci, przynajmniej dla
-nagrań z symulatora. Widocznie większość interesujących cech już jest znaleziona
-w ramach konwolucji, i dla tak prostych danych nie pomaga zwiększenie modelu.
+nagrań z symulatora. Na tej podstawie można wywnioskować, że większość interesujących 
+cech obrazu została już znaleziona w ramach warstw konwolucyjnych, więc dla tak prostych danych zwiększenie modelu jest nieefektywne.
 
-Co ciekawe w przypadku wytrenowanego już modelu do symulatora zredukowanie 
-rozdzielczości obrazów dziesięciokrotnie w każdym wymiarze(z rozdzielczości 
+Co ciekawe, w przypadku wytrenowanego już modelu do symulatora zredukowanie 
+rozdzielczości obrazów dziesięciokrotnie w każdym wymiarze (z rozdzielczości 
 320x160 do 32x16),
-i zwykłe przeskalowanie w górę przed zewaluowaniem wystarczy żeby urzymać się 
+i zwykłe przeskalowanie w górę przed zewaluowaniem wystarczy, żeby utrzymać się 
 na torze.
 
-Na dodatek sieć uczona na obrazie kolorowym bezproblemowo działa, gdy
-zredukuje się obraz do skali szarości a następnie powtórzy kanał trzykrotnie.
+Ponadto, sieć uczona na obrazie kolorowym działa bezproblemowo, gdy
+zredukuje się obraz do skali szarości. Jedyne, co należy wykonać to stworzyć obraz kolorowy, w którym każdy z kanałów RGB będzie powtórzonym obrazem wejściowym.