自律走行ロボットのための深層学習による物体認識
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[太田研 公開用Wiki]]
*自律走行ロボットのための深層学習による物体認識 [#dfba4831]
#contents
*はじめに [#a31636ba]
本章では,初めに研修背景としてつくばチャレンジという実験...
**つくばチャレンジ [#eb58f74b]
人間と共存するロボットの技術開発及び発展の為に,様々な大...
つくばチャレンジは「人間とロボットが共存する社会の実現...
以下の図1.1につくばチャレンジ2018のコースを示す.
CENTER:#ref(tsukuba_cource.png,center,65%)
CENTER:図1.1:つくばチャレンジ2018のコース
**つくばチャレンジのロボットにおける移動補助のための物体...
つくばチャレンジのロボットは自律走行であるため,予め設計...
しかしながら,ロボットはそのままだと物体の種類の分別はお...
これには先行研究が多くある.何故ならば,一つのプログラム...
例を2つほど上げよう.
先ず一つ目としては,参考文献 [1] の信号検出手法の研究で...
二つ目としては,参考文献 [2] の特定人物検出手法の研究で...
これらに共通する利点としては,シンプルなため比較的コスト...
一方で,コストこそかかるが実際の大会等で他の既存手法をこ...
*深層学習を用いた物体検出 [#wfe59bda]
本章では,深層学習を用いた物体検出アルゴリズムとして,比...
**従来の深層学習を用いた物体検出 [#qce28da9]
深層学習を用いた物体検出と一口にいっても様々な種類があ...
YOLOの説明の前に既存の深層学習を用いた物体検出アルゴリ...
***GoogLeNet [#d394b2db]
GoogLeNet[3]は深層学習の中で画像認識に特化したもので,訓...
構造としてはInceptionモジュールという複数の畳み込み層や...
また,過学習を抑えるためにpooling層も少々特殊な処理をし...
参考文献[4]でもこれを用いて信号を検出しようとしていたが...
***R-CNN [#vebede93]
機械学習の中でも最も有名といっても過言ではないCNNの論文...
アルゴリズムとしては,入力画像に対してSelective Search[6...
最近ではFaster R-CNNなどの新しいアルゴリズムが出たりも...
***SSD [#g9318f98]
GoogleNetやR-CNNなどはBounting\ Boxを少しづつずらしなが...
しかし,SSDはそれらとは異なり,画像自体を先ずグリッドで分...
更にExtra\ Feature\ Layersという畳み込み層をネットワー...
参考文献[7]ではSSDを用いて歩行者の検出を行っており,2030...
***つくばチャレンジにおいての物体検出 [#uffec208]
上記に挙げたような深層学習はコストが高い分,学習に汎用性...
しかし,GoogleNetやR-CNNはつくばチャレンジにおいての物体...
また,SSDにおいては人の検出は高い精度できている上に,リア...
R-CNNにおいてはFaster R-CNNや,SSDにおいてはRefineDetな...
**YOLOの概要と説明 [#u63b8af6]
yoloはJoseph Redmonらにより作成された,ディープラーニン...
2015年1月に初版となるyolov1[8]を出し,2016年12月にyolov2...
アルゴリズムとしては,まず学習の際に分別したいクラスごと...
検出の際は,その情報を元にまず検出したい画像を同じように...
グリッド分割の細かさは,Yolov1では一枚の画像に対し7*7の...
CENTER:#ref(BB.png,center,70%)
CENTER:図2.1:Bounting Boxの例
性能としては上記の画像認識のアルゴリズムであるR-CNNなど...
そのため,1つのネットワークで完結しているためシンプルであ...
1つ目のメリットとしては処理が速いことがある.画像認識に...
2つめのメリットとしては,既存の「sliding window」や「Reg...
3つ目のメリットとしては,YOLOが汎化性能が高く,様々なもの...
また,YOLOにおいては最先端なアルゴリズムと比較すると処理...
*評価実験 [#f92701bc]
本章では,YOLOv3による学習の方法と,YOLOv3に対して評価実...
**YOLOv3の学習方法 [#i7d96c97]
YOLOv3などの深層学習による物体認識アルゴリズムの学習の...
今回は,tzutalin氏により作成されたlabellmgにというラベリ...
以下が実際のラベリング風景である.
CENTER:#ref(labelimg.png,center,50%)
CENTER:図3.1: ラベリングツール labellmg.py
これによって作成したアノテーションファイルと画像を一つ...
学習コマンドを実行すると,画像を1枚1枚見てその画像を事前...
それを繰り返し行うことで最終的に検出したい物体の形状や...
**学習に使用したデータセット [#g90d294a]
本研究室が出場したつくばチャレンジの,実際の横744px縦480...
学習に使用したのは以下のような検出したい物体が一つでも...
CENTER:&ref(tsukuba_a0001.jpg,left,50%);&ref(tsukuba_b000...
CENTER:&ref(tsukuba_f0001.jpg,center,30%);&ref(tsukuba_g0...
CENTER:図3.2:学習に使用した画像群
これらのような画像を利用して学習を行った.
**実験方法 [#rc517f21]
今回,学習に使用していない横744px縦480pxのつくばチャレン...
また,評価の方法としては検出したい物体を全て検出できてい...
例としては以下の画像のように判別する.
CENTER:&ref(tsukuba_TP_TF.jpg,center,100%);&ref(tsukuba_N...
図3.3:TPかつTNの画像例
図3.4:FNかつTNの画像例
図3.5:TPかつFPの画像例
このような実験方法と評価方法により検出を行い,結果となる...
**実験結果 [#a34f3c05]
上に記述したような実験方法において,学習に使用していない...
CENTER:#ref(kekka.png,center,80%)
CENTER:図4.1:実験結果
総画像枚数2124枚に対しTP,画像中に存在する検出したい物体...
またFP,画像中の物体ではない背景を一つでも物体として検出し...
よって,TPとFNの結果より検出したい5物体を全て検出できて...
また,GTX1080を用いて38FPSの速度で検出を行えた.
*考察 [#e18fa1b6]
つくばチャレンジの画像2124枚に検出を行った結果,検出した...
この理由には,先ず大きな影響を与えている面としてつくばチ...
つくばチャレンジにおいては実験走行会を行う年度毎に実験...
しかし,今回の検出においては2018年度のつくばチャレンジの...
更には,信号という光を放つために天気などの環境光度や周囲...
実際に,つくばチャレンジでない他の信号に対して検出を行っ...
また,つくばチャレンジの画像には車や人,自転車などある程...
しかしながら92.891%という高い精度で検出しており,実際に...
これは恐らく,つくばチャレンジのルール上,ロボットの自律...
実際に,ロボットを横から撮影して人が見切れている場合など...
しかし,学習していない状況や形状のロボットも少し精度が低...
それとは別に,更に精度や速度を向上させる方法についてだが...
また速度については,単純に更なる高性能なグラフィックボー...
*まとめ [#xb1e442f]
結果と考察から,YOLOv3によるつくばチャレンジの実際の画像...
しかしながら,動画に対しての検出とはいえ検出の際の矩形に...
そのため,学習の際のデータが535枚のところを増加させたり,...
また,さらなる学習データ数の増加やオプションの見直しによ...
*参考文献 [#wdffce56]
[1]江口 純司 : "つくばチャレンジ2016における自律移動ロボ...
[2]加藤 勇気 , 上山 晃司 , 森岡 一幸 : "つくばチャレンジ2...
[3]Christian Szegedy,et al : "Going deeper with convolu...
[4]井関 統 , 饗庭 大 , 小池 陽介 , 田中 凱季 , 大川 一也 ...
[5]Krizhevsky, Alex, llya Sutskever, and Geofferey E. Hin...
[6]Uijlings, Jasper RR, et al. : "Selective search for ob...
[7]志水 惇哉 , 小出 拓克 , 藤原 康弘 , 今津 篤志 : "つく...
[8]Joseph Redmon , Santosh Divvala , Ross Girshick , Ali ...
[9]Joseph Redmon , Ali Farhadi : "YOLO9000: Better, Faste...
[10]Joseph Redmon , Ali Farhadi : "YOLOv3: An Incremental...
終了行:
[[太田研 公開用Wiki]]
*自律走行ロボットのための深層学習による物体認識 [#dfba4831]
#contents
*はじめに [#a31636ba]
本章では,初めに研修背景としてつくばチャレンジという実験...
**つくばチャレンジ [#eb58f74b]
人間と共存するロボットの技術開発及び発展の為に,様々な大...
つくばチャレンジは「人間とロボットが共存する社会の実現...
以下の図1.1につくばチャレンジ2018のコースを示す.
CENTER:#ref(tsukuba_cource.png,center,65%)
CENTER:図1.1:つくばチャレンジ2018のコース
**つくばチャレンジのロボットにおける移動補助のための物体...
つくばチャレンジのロボットは自律走行であるため,予め設計...
しかしながら,ロボットはそのままだと物体の種類の分別はお...
これには先行研究が多くある.何故ならば,一つのプログラム...
例を2つほど上げよう.
先ず一つ目としては,参考文献 [1] の信号検出手法の研究で...
二つ目としては,参考文献 [2] の特定人物検出手法の研究で...
これらに共通する利点としては,シンプルなため比較的コスト...
一方で,コストこそかかるが実際の大会等で他の既存手法をこ...
*深層学習を用いた物体検出 [#wfe59bda]
本章では,深層学習を用いた物体検出アルゴリズムとして,比...
**従来の深層学習を用いた物体検出 [#qce28da9]
深層学習を用いた物体検出と一口にいっても様々な種類があ...
YOLOの説明の前に既存の深層学習を用いた物体検出アルゴリ...
***GoogLeNet [#d394b2db]
GoogLeNet[3]は深層学習の中で画像認識に特化したもので,訓...
構造としてはInceptionモジュールという複数の畳み込み層や...
また,過学習を抑えるためにpooling層も少々特殊な処理をし...
参考文献[4]でもこれを用いて信号を検出しようとしていたが...
***R-CNN [#vebede93]
機械学習の中でも最も有名といっても過言ではないCNNの論文...
アルゴリズムとしては,入力画像に対してSelective Search[6...
最近ではFaster R-CNNなどの新しいアルゴリズムが出たりも...
***SSD [#g9318f98]
GoogleNetやR-CNNなどはBounting\ Boxを少しづつずらしなが...
しかし,SSDはそれらとは異なり,画像自体を先ずグリッドで分...
更にExtra\ Feature\ Layersという畳み込み層をネットワー...
参考文献[7]ではSSDを用いて歩行者の検出を行っており,2030...
***つくばチャレンジにおいての物体検出 [#uffec208]
上記に挙げたような深層学習はコストが高い分,学習に汎用性...
しかし,GoogleNetやR-CNNはつくばチャレンジにおいての物体...
また,SSDにおいては人の検出は高い精度できている上に,リア...
R-CNNにおいてはFaster R-CNNや,SSDにおいてはRefineDetな...
**YOLOの概要と説明 [#u63b8af6]
yoloはJoseph Redmonらにより作成された,ディープラーニン...
2015年1月に初版となるyolov1[8]を出し,2016年12月にyolov2...
アルゴリズムとしては,まず学習の際に分別したいクラスごと...
検出の際は,その情報を元にまず検出したい画像を同じように...
グリッド分割の細かさは,Yolov1では一枚の画像に対し7*7の...
CENTER:#ref(BB.png,center,70%)
CENTER:図2.1:Bounting Boxの例
性能としては上記の画像認識のアルゴリズムであるR-CNNなど...
そのため,1つのネットワークで完結しているためシンプルであ...
1つ目のメリットとしては処理が速いことがある.画像認識に...
2つめのメリットとしては,既存の「sliding window」や「Reg...
3つ目のメリットとしては,YOLOが汎化性能が高く,様々なもの...
また,YOLOにおいては最先端なアルゴリズムと比較すると処理...
*評価実験 [#f92701bc]
本章では,YOLOv3による学習の方法と,YOLOv3に対して評価実...
**YOLOv3の学習方法 [#i7d96c97]
YOLOv3などの深層学習による物体認識アルゴリズムの学習の...
今回は,tzutalin氏により作成されたlabellmgにというラベリ...
以下が実際のラベリング風景である.
CENTER:#ref(labelimg.png,center,50%)
CENTER:図3.1: ラベリングツール labellmg.py
これによって作成したアノテーションファイルと画像を一つ...
学習コマンドを実行すると,画像を1枚1枚見てその画像を事前...
それを繰り返し行うことで最終的に検出したい物体の形状や...
**学習に使用したデータセット [#g90d294a]
本研究室が出場したつくばチャレンジの,実際の横744px縦480...
学習に使用したのは以下のような検出したい物体が一つでも...
CENTER:&ref(tsukuba_a0001.jpg,left,50%);&ref(tsukuba_b000...
CENTER:&ref(tsukuba_f0001.jpg,center,30%);&ref(tsukuba_g0...
CENTER:図3.2:学習に使用した画像群
これらのような画像を利用して学習を行った.
**実験方法 [#rc517f21]
今回,学習に使用していない横744px縦480pxのつくばチャレン...
また,評価の方法としては検出したい物体を全て検出できてい...
例としては以下の画像のように判別する.
CENTER:&ref(tsukuba_TP_TF.jpg,center,100%);&ref(tsukuba_N...
図3.3:TPかつTNの画像例
図3.4:FNかつTNの画像例
図3.5:TPかつFPの画像例
このような実験方法と評価方法により検出を行い,結果となる...
**実験結果 [#a34f3c05]
上に記述したような実験方法において,学習に使用していない...
CENTER:#ref(kekka.png,center,80%)
CENTER:図4.1:実験結果
総画像枚数2124枚に対しTP,画像中に存在する検出したい物体...
またFP,画像中の物体ではない背景を一つでも物体として検出し...
よって,TPとFNの結果より検出したい5物体を全て検出できて...
また,GTX1080を用いて38FPSの速度で検出を行えた.
*考察 [#e18fa1b6]
つくばチャレンジの画像2124枚に検出を行った結果,検出した...
この理由には,先ず大きな影響を与えている面としてつくばチ...
つくばチャレンジにおいては実験走行会を行う年度毎に実験...
しかし,今回の検出においては2018年度のつくばチャレンジの...
更には,信号という光を放つために天気などの環境光度や周囲...
実際に,つくばチャレンジでない他の信号に対して検出を行っ...
また,つくばチャレンジの画像には車や人,自転車などある程...
しかしながら92.891%という高い精度で検出しており,実際に...
これは恐らく,つくばチャレンジのルール上,ロボットの自律...
実際に,ロボットを横から撮影して人が見切れている場合など...
しかし,学習していない状況や形状のロボットも少し精度が低...
それとは別に,更に精度や速度を向上させる方法についてだが...
また速度については,単純に更なる高性能なグラフィックボー...
*まとめ [#xb1e442f]
結果と考察から,YOLOv3によるつくばチャレンジの実際の画像...
しかしながら,動画に対しての検出とはいえ検出の際の矩形に...
そのため,学習の際のデータが535枚のところを増加させたり,...
また,さらなる学習データ数の増加やオプションの見直しによ...
*参考文献 [#wdffce56]
[1]江口 純司 : "つくばチャレンジ2016における自律移動ロボ...
[2]加藤 勇気 , 上山 晃司 , 森岡 一幸 : "つくばチャレンジ2...
[3]Christian Szegedy,et al : "Going deeper with convolu...
[4]井関 統 , 饗庭 大 , 小池 陽介 , 田中 凱季 , 大川 一也 ...
[5]Krizhevsky, Alex, llya Sutskever, and Geofferey E. Hin...
[6]Uijlings, Jasper RR, et al. : "Selective search for ob...
[7]志水 惇哉 , 小出 拓克 , 藤原 康弘 , 今津 篤志 : "つく...
[8]Joseph Redmon , Santosh Divvala , Ross Girshick , Ali ...
[9]Joseph Redmon , Ali Farhadi : "YOLO9000: Better, Faste...
[10]Joseph Redmon , Ali Farhadi : "YOLOv3: An Incremental...
ページ名: