交通事故には, 自動車のドライバーの認知・判断の遅れが原因で起こるものがある.
これを未然に防ぐために安全運転支援システムの開発が行われている.
このシステムではカメラで自動車の前方を撮影し, 画像処理で状況を解析することによりドライバーに注意を促す.
システムでの検出すべき対象には歩行者や障害物,車線や標識,信号機などがあるが
今回はその中でも標識について着目し,その認識について考える.
標識の認識手法には色情報や形状特徴を用いたものや機械学習によるものなど多数存在するが,安全運転支援システムではリアルタイムでの処理が求められる.
佐々木氏らは形状特徴を用いたアルゴリズムの中でも高速とされているSURF(Speeded Up Robust Features)にエッジ画像と色情報を
組み合わせることでもともとのSURFよりも高い認識率を得られる手法[1]を提案した.
しかし実際に検証してみると, 太陽光の照明変動等による色の変化等が原因で, 実環境下での標識の認識精度は高いとはいえない.
本研究では, 上記の手法を従来手法とし従来手法をもとに, また基本的な手順は変更せずに
色の変化に影響を受けにくい実環境に適応した認識手法を提案する.
従来手法の簡単な流れについて説明する.
ここで標識画像, 車載カメラの画像を入力画像として用意する.
まず, 入力画像中の色情報を用いて標識があるとする領域(以下, 認識候補領域)を検出しておく.
続いて入力画像のエッジ画像を作成する. マッチングに入力画像ではなくエッジ画像を用いることによって入力画像から特徴点を検出するより
多くの特徴点を検出することが出来る.このとき入力画像のエッジ画像に対しSURFの特徴点を認識候補領域に該当する領域以外からは検出しないようにする.
そして入力画像のエッジ画像から検された特徴点と標識画像から抽出された点のマッチングをとり, 標識が存在する部分を特定, 認識に至る.
SURF[2]とは一般に物体認識や検出などに用いられるアルゴリズムであり, 照明や回転, スケールに不変で処理速度に優れていることが特徴である.
エッジとは, 画像中の色や明るさが急激に変化している部分のことである.
特に物体の持つ輪郭を示すことが多く, その検出は画像の1次微分や2次微分などを用いて行われるが,今回はCanny法[3]を用いた.
SURFなど特徴点による画像の認識は検出したい特徴点が多いほど標識画像と一致するかの判断要素が増え, 標識の認識・識別が行いやすくなるため精度が向上する.
そこで特徴点の数の増加が課題となるが, 従来手法では特徴点検出を入力画像からせず,
図2のような, 入力画像からエッジ検出した画像を用いることで特徴点の増加を図っている.
エッジ画像を用いることで特徴点を増やすことに成功し, より多くの特徴点での比較が可能となったが, 標識など認識したい物体以外の部分からも特徴点が多く検出されてしまう. 特徴点が多くなる分, 余分な特徴点も増加し,その点が多いほど特徴点の比較にも多くの時間がかかってしまう. そこで色情報を用いて認識候補領域を作成し, 画像上に現れる特徴点の絞り込みを行う.
認識候補領域を作成するために, まず入力画像中からRGB表色系によって標識の持つ色の抽出を行う.
RGB表色系とはコンピュータのモニターなどにも用いられている赤(R)・緑(G)・青(B)の三原色によって幅広い色を再現する加法混色の一種である.
標識を構成する色は赤・青・白としている. 従って画像中から赤と青を持つ画素を検出すればよい.
ここで白色については画像中に物体が多く存在するため検出しない.
赤と青についてそれぞれ下のような条件を設定し, 該当する画素は白(255), そうでない画素は黒(0)として入力画像中の全画素から2色の検出を行う.
図4は入力画像とそこから赤・青を抽出した結果の画像である.
入力画像によっては大きく空が写っているものがあり,そのような画像では空を検出するおそれがある.
空の部分を残したままでは画像中の空から検出された特徴点も残ってしまい誤認識の原因となる.
図4[b]上部分のような赤青抽出画像中に存在する標識よりも大きく横長な白い領域は空であると考えられる.
そこで赤青抽出画像中の標識のサイズよりも大きい局所的な範囲の画素がすべて白であれば空とみなしその部分を黒く潰す.*1
画像から赤と青の画素を抽出しただけの画像では標識内に隙間ができたり,
標識と似たような色を持つ物体など細かいノイズ(ごま塩ノイズ)や領域の切れ込みなどが多く存在する.
このままでは標識の間にできた隙間によって認識候補領域に標識部分が入らず,標識が認識できなくなってしまう.
そこでクロージング処理で隙間を埋め, メディアンフィルタを用いて細かなノイズを取り除き認識候補領域の形状を修正する.
図5は赤と青の画素を抽出後, 形状の修正まで終えた認識候補領域の最終的な形である.
以上の処理によってSURFでの検出が可能となる. エッジ画像を用いることで特徴点を増やし, 余分な点を認識候補領域により削除した入力画像のSURF特徴量と標識画像の特徴点のSURF特徴量を比較し, 対応点を求める(マッチング). そして対応した特徴点が標識画像に多く集まっていれば,標識画像が入力画像中に存在すると判断する.
実環境下で従来手法を用いて標識の認識を行うと, マッチングに成功するより誤認識する画像の枚数の方が多い.誤認識の原因の多くが, 時間の経過や車の向きの変化等による照明の変化である.その他にも, 逆光などで認識漏れを起こしてしまう画像も多くあった.
そこで認識候補領域の作成処理と未検出扱いの画像に手を加え, 従来手法の改善を行う.
従来手法での誤認識の主な原因は照明の変化であり, 些細な光の変化によって認識候補領域が変化したり, 合わせて特徴点が変化してしまうことも多く見られた.
そこで従来手法で用いたRGB表色系ではなく, RGB表色系から以下の式で求められるrg色度を用いる.
rg色度は明るさを無視しているので明るさの影響を受けにくい. この式を赤青画素抽出条件を式化したものに代入, rについて表すと
という式を得る.提案手法ではこの条件で2色の抽出を行う.
認識候補領域の条件を色情報以外から加える.1つ目が探索範囲の指定, 2つ目に円形度・面積による絞込である.
認識候補領域は画像全体から作成している. しかし, 車載カメラから撮影しているため, 画像下方には標識が存在するようなことはない. そのままだと画像下方に作成された認識候補領域中の特徴点とマッチングしてしまう可能性がある.
認識候補領域は赤青抽出画像に青空除外処理とクロージング処理, メディアンフィルタを用いて作成する.
そのため色の抽出の具合によっては物体が変な形状で領域に出てしまったり,クロージング処理とメディアンフィルタでも取りきれなかったノイズも存在することがある.
そこで各認識候補領域の輪郭情報から得た面積と周囲長から円形度を算出し,円形度で複雑な形状の領域, 面積で標識よりも小さい領域を取り除く.
円形度とはその図形がどれだけ円に近いかを示す値で以下の式で表される.
円形度は0から1の範囲で値をとる. 真円で最大値1をとり,図形の形状が複雑になるほど値が小さくなっていく.
今回は認識候補領域中の複雑な形状の図形を取り除くことが目的なので円形度が0.25以下の領域を認識候補領域からはずす.
日光の当たり方によっては標識自体の色が暗くなったり, 逆光で画像全体が白っぽくなることがある.
このような場合, 標識がある画像でも認識されないことがあるので,対応する必要がある.
そこで認識されなかった画像の全画素のRGB値に対し,R値を1.6倍, B値を0.9倍に変更することで画像の色味変更を行う.
色味変更を認識されなかった画像に対して行うことにより, 画像中の標識の色も元画像よりはっきりし, 画像全体の赤みが強くなり画像の明るさも変化する.
以上から認識候補領域の変化と, 更に特徴点の増加が見込まれる.
色味変更した画像に対し, 今までの処理をもう一度行うことで標識を改めて認識する.
従来手法と提案手法の性能を比較するために次の実験を行う.
画像の認識率と処理時間を性能を比較するための評価項目とし, 認識率を以下のように定義する.
各実験, 市街地を走行中の自動車から撮影した画像を用いる. 撮影時の画像の大きさは1920×1080であるが, 960×540に画像を縮小して使用している.
この実験では以下の画像を用いて従来手法・提案手法の性能の評価を行い,加えて提案手法の再検出処理がどれだけ有用なのかについても検討する.
この実験では2種類の標識を用いて従来手法・提案手法の性能の評価を行う.使用画像は以下の通りである.
追い越し禁止
止まれ
認識率及び処理時間, 画像の内訳を表に表す. 左から従来手法・提案手法(再検出処理なし)・提案手法(再検出あり)となる. 表の1番下の項目は(標識有・未検出)画像の誤認識と未検出の内訳である.
なお, ここでの提案手法の実験は再検出処理有りを採用する.
認識率及び処理時間, 画像の内訳を表に表す. また, 表の1番下の項目は(標識有・未検出)画像の誤認識と未検出の内訳である.
実験を行った結果, 提案手法の有用性を確認できた.
従来手法による実験の誤認識の原因を調べてみると実験に用いた画像の6割近くが色による誤認識となっていたが,
色情報をRGB表色系からrg色度に変更したことにより, それらの画像の誤認識を防ぐことが出来た.
また, (標識有・未検出)数の削減と (標識無・未検出)数の増加に成功し,
再検出処理を行うことによって標識が写っている画像での提案手法の性能は向上したといえる.
しかし,標識が写っていない画像では元々誤認識数が多かったとはいえ再検出処理有り無しそれぞれの結果を見ると,
標識が写っていない画像での誤認識の割合が1.3倍ほどになってしまった.
これは正しく (標識無・未検出)と判定された画像も再検出処理されたため特徴点数が変化, 判定も変わってしまったことが原因だと考えられる.
標識が写っていない画像での内訳としては, 別の標識の認識をしてしまう割合が一番高く,
認識候補領域の色の抽出時に赤または青のみの標識でも領域の候補になることが原因である.
また, 標識画像よりも大きな標識のある画像は認識候補領域にその標識が含まれ多くの特徴点が現れてしまうためそれらの対応も必要である.
2つの結果を見ると, 「止まれ」では(標識有・検出)と(標識無・未検出)の和が従来手法の約4.6倍になり, 認識率は実験に用いた標識3種類の中で1番良い値となった.
用いた標識の中で「止まれ」は唯一日本語のシンボルである.
そのため独特の形状によって, 検出される特徴点が他の標識より多いことが理由だと考えられる(図17).
一方, 「追い越し禁止」の結果を見ると他の標識よりも提案手法での認識率が低い.
「追い越し禁止」の標識の多くは「速度規制」などの標識と一緒に設置されており,
その多くが「追い越し禁止」と同じく赤・青・白の3色で構成されている.
そのためにrg色度でも抽出してしまい認識候補領域に含まれてしまうことが原因だと考えられる.
本研究では車載カメラ画像を対象とした, 標識の認識手法を提案した.
提案手法では, 標識をエッジ画像と色情報によりSURFによって認識する従来手法を元に,エッジ検出やSURFによる処理はそのままに, 従来手法で用いた色情報の変更や
探索範囲の指定等を行ない認識精度の向上・処理時間の短縮を図った.
さらにこれらをプログラムで実装した後に実環境下での実験から提案手法の認識率と処理時間を求めることによって従来手法との比較を行った.
その結果, 3種類の標識において提案手法は従来手法より性能が良いことがいえた.
また, 認識率にさほど変化はないといえ, 再検出処理は標識が写っていない画像にたいしては効果があまり無く, 却って誤認識のもとになってしまう場合があった.
しかし,再検出処理を行うことによって標識が写っている画像での提案手法の性能は向上したといえる.
今後の課題としては,
などが挙げられる. また, 入力画像に対しても, 時間帯や場所等撮影するパターンや環境を増やし, より多くのデータを用意することも重要だと考える.
[1] 佐々木栄裕, 今野峻一, 恒川佳隆, "エッジ画像と色情報を用いたSURFアルゴリズムの検討",計測自動制御学会東北支部 第280回研究集会(2013.5.29) 資料番号280-4.
[2] Herbert Bay, Tinne Tuytelaars, Luc Van Gool, "SURF:Speeded Up Robust Features",computer vision-ECCV Lecture Notes in Computer Science, 2006.
[3] J. Canny, "A Computational Approach To Edge Detection", IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI), vol. 8, no. 6, pp. 679-714, Nov.