わかりやすいパターン認識１章 / Pattern Recognition Manual Easy to understand SS 01

わかりやすいパターン認識第⼀章パターン認識とは︖

パターン認識の定義観測されたパターンを予め定められた複数の概念（class）のうちの⼀つに対応させる処理

パターン認識の事例 • ⼿書きのアルファベットを２６クラスに対応させる • ⾳声データを五⼗⾳や単語に対応させる（⾳声認識） • ⼼電図波形から⼼臓の異常・正常状態を判定構造化データ、⾮構造化データ（画像・⾃然⾔語・⾳声）に関わらず様々な分野で「パターン認識」はある。

パターン認識の⼀般的な処理の流れ 1. 前処理 1. ノイズ除去 2. 正規化 2. 特徴抽出 1.
本質的な特徴のみ抽出 3. 識別 1. 辞書と照合識別認識

特徴ベクトルと特徴空間 • d個の特徴︓d次元特徴ベクトルx • クラス総数c︓クラス名ωc • 特徴ベクトルのはる空間＝特徴空間 • 特徴空間じょうで、特徴ベクトルは、クラスごとにかたまっているはずで、
それらの塊＝クラスタ

⼿書き数字認識の例（5x5メッシュ2値画像） • 最もシンプルには…225パターン • 中には数字に関係ないものもある – リジェクト領域 • リジェクト領域は２種類
– 「どこにも属さない」と「識別困難」 • 辞書作成は必須。辞書作成⾃体が、識別処理に他ならないからである

⼿書き数字認識の例（5x5メッシュ2値画像） • 全パターンは⾮現実的、代表パターンだけを記憶（≒識別辞書に記録）する⽅法がある。 • 代表パターン＝プロトタイプ • 各特徴ベクトルが、どのプロトタイプに最も近いかで判定することが多い
（Nearest Neighbor rule︓NN法/最近傍決定則） • より⼀般化すると、k-NN法。最も近いk個のプロトタイプを選び、k個のうち最も多くが属しているクラスを判定結果とするやりかた。

特徴空間の分割〜プロトタイプを設定する • 全数記憶⽅式 – 現実のデータをサンプリングし、全体をよく表すパターンを（識別のための代表パターンとしての）プロトタイプとする⽅式 – 【注】サンプリング結果はすべてを表すものではない
• プロトタイプ⽅式→k-meansにつながる – 各クラスに対して、⼀つのパターンを選ぶという発想 – クラスの重⼼位置を選ぶというのは、⾃然＝k- means – クラスごとの代表パターン間の垂直⼆等分線（多次元空間であれば、超平⾯）を決定境界という

終わり

わかりやすいパターン認識１章 / Pattern Recognition Manual Eas...

わかりやすいパターン認識１章 / Pattern Recognition Manual Easy to understand SS 01

masso

More Decks by masso

Other Decks in Science

Featured

Transcript

わかりやすいパターン認識第⼀章パターン認識とは︖

パターン認識の定義観測されたパターンを予め定められた複数の概念（class）のうちの⼀つに対応させる処理

パターン認識の⼀般的な処理の流れ 1. 前処理 1. ノイズ除去 2. 正規化 2. 特徴抽出 1.

特徴ベクトルと特徴空間 • d個の特徴︓d次元特徴ベクトルx • クラス総数c︓クラス名ωc • 特徴ベクトルのはる空間＝特徴空間 • 特徴空間じょうで、特徴ベクトルは、クラスごとにかたまっているはずで、

⼿書き数字認識の例（5x5メッシュ2値画像） • 最もシンプルには…225パターン • 中には数字に関係ないものもある – リジェクト領域 • リジェクト領域は２種類

終わり