太田研 公開用Wiki

つくばチャレンジのための色情報と形状情報を用いた人物検出手法

はじめに

色覚異常とは、目の錐体が機能しないために、正常な人とは異なる色の見え方 になってしまうことである。原因としては遺伝などの先天的な原因や、病気などの後天的な原因などがあり、 日本人の男性で 5 % , 女性で 0.5 %の割合でいる。この割合は小学校のクラスの中 に一人いるかいないかくらいの割合であり、身近にいる割合である。こうした人々 を理解し、配慮することはとても重要である。 現代ではメディアが発展して色を区別や強調するために使用したりしている広告 や、路線図などが多く存在し、色が非常に多く使われている。色を使うことで文 字量を少なくし、シンプルにすることができる。また、イメージとして頭に残り やすくなる。正常な人にとってはこのような色で区別する方法はとてもわかりや すく、便利な表現方法である。しかし、色覚異常者にはそのような色を判別する ことができずに、不便に感じてしまうことが多々ある。また、日常生活において も色の判別ができないために不利益を被ってしまう。こうした不利益を色覚異常 者が被らないように画像処理によって手助けすることは非常に有効的である。本 研究では、主にコンピュータ上でグラフなどを使用する場合に色が混同してしまっ ている状況を想定し、画像処理を用いて色覚異常者が判別できない隣り合う色の 変化を色勾配を利用することで判別できるようにする手法を提案する。

 

色覚異常の原理

人の網膜上には視細胞という光に反応する細胞があり、これらが受ける光の刺 激が脳に伝わり、人間は見ることができる。 視細胞には 2 種類あり、桿体と錐体と呼ばれている。2つはそれぞれ別の働きをし ていて、桿体は主に暗所で機能して、色の知覚に関しているのは錐体の方である。 錐体が反応する光の波長は 380∼780nm であり、これを可視光と呼ぶ。可視光のど の部分の波長を感じるかによって種類があり、 L 錐体、 M 錐体、 S 錐体が存在する。 この3種類の刺激の比によって色を視認することができる。おおよそ L 錐体が赤 色(長波長)、 M 水錐体が緑色(中波長)、 S 錐体が青色(短波長)の波長を感じ ることができる。色覚異常とはこれら3種類の錐体の内1つ以上の錐体になんらかの以上が発生し、機能していない状態のことである。原因としては前述したように、先天的な ものや病気などが考えられる。色覚異常には機能していない錐体の組み合せによって何種類か存在する。機能が残っている錐体の数が3つある場合は3色覚、2つなら2色覚、1つなら1色覚という。そして機能していない錐体が L 錐体なら1型、 M 錐体なら2型、 S 錐 体なら3型呼ぶ。 2 色覚の場合は色の完全に知覚できないというわけではなく、特定の範囲の色の知覚は可能である。 L 錐体だけが機能していなければ 1 型 2 色覚、 M 錐体だけが機能していなければ 2 型 2 色覚というように、これらの組み合わせで色覚異常の種類を表す。色覚異常 の大半は 1 型 2 色覚と呼ばれる色覚異常で、つまり L 錐体が機能していない人た ちである。よって本研究は 1 型 2 色覚を対象として進めることにする。この1型 2 色覚を第一色盲と呼ぶ。第一色盲は緑系統と赤系等の色が判別することができな いという問題がある。正常な方の見え方と色覚異常者の方見え方を以下に示す。 図 4 は正常な方の見え方である . 図 5 は色覚異常者の方の見え方である . 図 5 のように色覚異常者は見える色の種類が少なくなり、色の判別が非常に困難 であることがわかる。   

混同色の境界検出アルゴリズム

色空間の変換

RGB 表色系とは R 、 G 、 B 、つまり Red,Blue,Green の3つの要素を用いて色を 表現する方法である。この表色系は一般的なディスプレイやカメラなどの画像で 用いられる。 RGB はそれぞれ 0 から 255 の値をとり、すべて 0 にすると黒、 255 にすると白になる。赤を表現する場合は R のみを 255 にして G と B の値は 0 にす る。他の色もそれぞれの値の組み合わせによって表現される。 RGB 表色系の一つして CIERGB というものがある。これは CIE( 国際照明委員 会 ) が定めたもので RGB の定義を波長 700nm(R),546nm(G),435.8nm(B) の単色光 としている。この RGB 表色系は色知覚のよい近似であるが、人間が知覚できる色 を完全に網羅しているわけではない。レーザー光などにみられる単一波長の色は RGB 色空間の外側であって単に RGB の混ぜあわせだけでは表現できない。これ を表現するために RGB に負の値を許さなければならない。しかし、負の値は扱い にくいため負の値をなくすために考えだされたのが XYZ 空間である。 XYZ 空間 の XYZ は直感的に何を表しているか RGB 空間と比較するとわかりにくいが Y は 明るさ、 Z は青み、 X はそれ以外の要素を含んでいる。 RGB 空間から XYZ 空間に変換させるためにまず、 RGB を sRGB に変換する。 sRGB とは色空間の国際標準規格である。ディスプレイなど機器の違いによって異 なる色にならないようにするための表現形式である。 RGB の値を変化させた場合 ディスプレイ上でも同じように変化しているわけではない、ガンマ特性というガン マをγとして (RGB) γ に比例して変化する。色空間を変換する場合このガンマ特 性を考慮して変換しなくてはならない。よって XYZ 空間に変換する場合に RGB 空間を sRGB 空間に変換する必要がある。

色勾配の計算

色の境界を調べるため、色の変化している部分を計算する。色の変化している 部分を色勾配といい、色勾配の計算方法を説明していく。画像を RGB から XYZ 空間に変換する。 画像の位置 (i,j) の画素 (X i,j , Y i,j , Z i,j ) と隣の画素 (X i+1,j , Y i+1,j , Z i+1,j ) とする。 この画素の差を計算することで横方向の色勾配 Cx を求めることができる。同様に 縦方向の色勾配を求めると これらの色勾配から色覚異常者が判別できる成分と判別できない成分を求める。

まず、色覚異常者が判別できない成分を抽出してエッジ e i,j とする。

色覚異常者が判別できない境界の検出

 作成した画像は色覚異常者が見える成分の画像と色覚異常者が見えない成分の 画像の二枚である。それらを画像にする際、計算した結果をそのまま画像にして も値が非常に小さく、すべて黒の画像が作成されるだけである。よって、作成し たそれぞれの画像で最大値を求め、最大値で割って 255 を掛けることによって画 像にしている。 これらの画像から色覚異常者が判別できない境界のみを求める。方法としては、 色覚異常者が見えない成分の境界画像 a 、色覚異常者が見える成分の境界の画像 b とする。そして画像 a から画像 b を引くと色覚異常者が見えない成分だけが残る ので色覚異常者が判別することができない境界を取り出すことができる。差分を とった時に負の値になったものはノイズの原因になるので負の値は 0 にする。 しかし、これだけではまだ色覚異常者が判別できない境界だけではなく、余分 な境界も含まれてしまう画像cができてしまった。この余分な境界を消すために 以下のことを行う。 余分な境界とは色覚異常者が判別できる境界である。余分な境界が出てきてし まう原因は画像 a から画像 b を引いた時に、画像 a の色覚異常者が判別できると ころの値が 0 にならなかったということである。このような余分な境界は必要な い。したがって色覚異常者が見えない成分画像 a があっても、色覚異常者が見え る成分画像 b が一定数値以上あれば色覚異常者が見えない成分は無視することに する。画像 b で、ある一定以上の値を超えたということは色覚異常者には判別が できるということである。 したがって閾値を設定して閾値を超えたところの値を画像 b で最大値の 255 に しておけば画像 a と画像 b の差分を取るときに画像 a の値が 0 になって画像 a の余 分な境界を消すことができる。そして残った部分が色覚異常者の方見えない境界 であるので残った部分を最大値 255 に強調して画像を作成する。

実験と結果

提案手法の確認

グラフに対しての処理


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS