本書理論・手法の適用分野
・顔画像認識 ・生体認証 ・自動目視検査 ・自動車両計測
・歩行者認識 ・前方車両認識 ・車線認識 等々画像一般
☆画像理解・認識の前処理(フィルタリング・変換)
☆2次元情報から3次元情報を復元
☆認識率を低下させないで特徴空間を低次元化
☆対象変動に対しロバストな認識
☆識別関数(クラス間境界)の構成
☆新規性のある応用研究事例(10例)
人間の視覚機能を代行するシステムを工学的に実現することを目的とする画像理解・パターン認識は近年、その重要性を増している。例えば、1)工場の生産工程における目視検査の自動化、2)空港のパスポートコントロールにおけるセキュリティチェックのための顔画像認識の自動化、3)個人認証のための生体認証、4)交通量監視のための車両計測の自動化、5)自動車運転支援のための歩行者認識・前方車両認識・車線認識、など現代社会の至るところで画像理解・パターン認識に対するニーズが存在する。
本書は、視覚機能代行システム実現の基礎となる画像理解とパターン認識の理論について解説するとともに、応用についても述べる。
まず、3次元空間中の対象物をカメラで、2次元画像情報として観測するときの射影モデルから始める。2次元画像情報から元の3次元空間情報を復元するための画像理解の理論について解説する。人間が両眼で立体視するのと同じ原理により、複数のカメラで対象物を観測した画像情報から、3次元空間情報を復元する三角測量法、および1台のカメラで観測した画像情報から、3次元空間情報を復元する単眼法について解説する。
次に、画像情報から特徴空間を構成するためのツールとなる基本的画像処理手法について解説し、特徴空間からカテゴリー分類(識別)するためのパターン認識の理論について解説する。しかし、特徴空間は一般に高次元空間となるので、計算時間が掛り、且つ大きなメモリ容量を必要とするなどの欠点を有する。カテゴリー分類するための解説に入る前に、これらの欠点を克服するために、認識率を低下させることなく効率的に特徴空間の低次元化を実現する統計的理論について解説する。
更に、カメラの視点変動によって生じる画像における対象物の幾何学的変形に対して、ロバストな認識法を構築するとき有効となる射影不変量およびアフィン不変量について解説する。また、特徴空間において分布する特徴の学習データから、未知の特徴が与えられたとき、それが属するカテゴリーを決める識別関数を構築する学習法であるSVM(Support Vector Machine)とAdaBoost、そして近年、注目されているRVM(Relevance Vector Machine)についても解説する。
最後に、上記の理論を応用した、あるいは発展させた、新規性を有する興味深い研究事例について紹介し、画像理解・パターン認識の最近の動向について展望する。
本書はトリケップスセミナーにおいて、2006年から2008年に亙って私が講演した「画像理解・パターン認識の基礎と応用」を基に、内容をより充実したものである。内容の理解を深めることができるように、できるだけ多くの図と画像を用いる
こと、および適所に解答付きの例題を設けることに配慮した。本書を読むにあたっての予備知識として、線形代数とベクトル解析および確率の基礎理論を修得しておられることが望ましい。画像理解・パターン認識の研究開発において直面する問題
を解決しようとするとき、直ぐに役立つ手法を探すのみでは、問題を解決できるものではない。そのようなとき、理論の基礎に立ち戻ってじっくりと思考し、工夫することが問題解決の道であると思われる。このような観点から、本書では理論をで
きるだけ詳細に解説した。本書が画像理解・パターン認識の研究開発に携わる研究者・技術者の一助になれば幸甚である。
第1章 画像理解の基礎
1.1 3D 空間から画像への射影
1.1.1 中心射影
1.1.2 弱中心射影
1.1.3 擬似中心射影誕生の背景と経緯
1.2 カメラパラメータ
1.2.1 内部パラメータ
1.2.2 外部パラメータ
1.3 三角測量による3次元復元
1.3.1 エピポーラ拘束
1.3.2 ステレオ法
1.3.3 レンジファインダ
1.4 単眼視による3次元復元
1.4.1 8点アルゴリズム
1.4.2 オプティカルフローによる3次元復元
1.4.3 Shape from Shading
1.4.4 Dichromatic reflection model
第2章 パターン認識の基礎
2.1 画像処理手法
2.1.1 平滑化フィルタ
2.1.2 エッジフィルタ
2.1.3 ハフ変換
2.1.4 ガボール変換(Gabor transformation)
2.1.5 ウェーブレット変換(Wavelet transformation)
2.2 統計的特徴抽出
2.2.1 直交展開
2.2.2 PCA(Principal Component Analysis)
2.2.3 固有空間法
2.2.4 大規模行列の固有値問題の解法
2.2.5 LDA(Linear Discriminant Analysis:線形判別分析)
2.3 カテゴリー決定法
2.3.1 ベイズ決定法
2.3.2 フィッシャーの線形判別法
2.3.3 パターン・マッチング
2.3.4 MDD(Minimum Distance Decision)則
2.4 射影不変量
2.4.1 射影変換
2.4.2 射影不変量
2.5 アフィン不変量
2.5.1 アフィン変換
2.5.2 アフィン不変量
2.6 学習法
2.6.1 SVM(Support Vector Machine)
2.6.2 RVM(Relevance Vector Machine)
2.6.3 AdaBoost アルゴリズム
第3章 画像理解・パターン認識の最近の動向
3.1 多重特徴を用いるBayesian Filterによるロバストなトラッキング
3.1.1 数学的準備
3.1.2 ロバストなトラッキングに用いられる特徴
3.1.3 トラッキング・アルゴリズム
3.1.4 実験結果
3.2 時空的前後関係を利用する複数ターゲットの追跡
3.2.1 確率モデル
3.2.2 ターゲット追跡
3.2.4 逐次PPCA
3.2.5 実験結果
3.3 エピポーラ制約に優る幾何制約による移動物体領域の検知
3.3.1 移動物体領域検知の流れ
3.3.2 移動物体検知のための諸定義
3.3.3 エピポーラ制約の限界
3.3.4 Structure Consistency制約
3.3.5 アルゴリズムの実施法
3.3.6 実験結果
3.4 Matting problem の効率的解法
3.4.1 αmatte
3.4.2 Cost function
3.4.3 User input による制約
3.4.4 scribbleの位置決めのガイドとしてのeigenvector
3.4.5 結果
3.5 正準相関を用いた判別分析に基づく認識
3.3.1 諸定義
3.5.2 正準相関
3.5.3 判別分析のための変換行列T
3.5.4 変換T を求める反復アルゴリズム
3.5.5 実験結果
3.6 Mean Shiftによる特徴空間解析-不連続性を保持する平滑化と領域分割への応用
3.6.1 Mean Shift
3.6.2 Mean Shiftの応用
3.7 射影不変量の構成
3.7.1 基本的な定義
3.7.2 基本的射影変換
3.7.3 射影不変量の構成
3.8 透視(中心)射影の下でのshape from texture
3.8.1 Shape from textureの原理
3.8.2 Deformation gradient
3.8.3 Textre gradient equation
3.9 PCAとLDAの各弱点を克服する判別共通ベクトル法
3.9.1 判別共通ベクトル
3.9.2 実験結果
3.10 ベイズ則を用いた特徴成分選択を伴う識別法
3.10.1 確率的カーネル識別関数
3.10.2 EMアルゴリズムによるMAPパラメータ推定
3.10.3 実験結果