Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
わかりやすいパターン認識1章 / Pattern Recognition Manual Eas...
Search
masso
December 05, 2020
Science
0
190
わかりやすいパターン認識1章 / Pattern Recognition Manual Easy to understand SS 01
わかりやすいパターン認識のセルフ輪読会資料〜第一章
masso
December 05, 2020
Tweet
Share
More Decks by masso
See All by masso
Stacktrace for rs/zerolog users
masso
0
340
データ解釈学入門 第一部 / Data hermeneutics Part 1
masso
8
2.2k
時系列分析と状態空間モデリングの基礎 / Foundations of Time Series Analysis and State Space Models 0
masso
1
650
わかりやすいパターン認識2章 / Pattern Recognition Manual Easy to understand SS 02
masso
0
1k
分析環境紹介LT / the introduction of as my analysis env is
masso
0
130
データ解析のための統計モデリング入門6章 / Handbook-of-statistical-modeling-for-data-analysis-section6
masso
0
550
DLGが目指すコミュニティの形 / DLG Community Objective
masso
0
2.7k
PowerAutomateによる社員健康状態集計システム / Employee health status tabulation system with Power Automate
masso
0
1.5k
Other Decks in Science
See All in Science
データベース12: 正規化(2/2) - データ従属性に基づく正規化
trycycle
PRO
0
1k
データマイニング - グラフ構造の諸指標
trycycle
PRO
0
200
データベース14: B+木 & ハッシュ索引
trycycle
PRO
0
500
データベース15: ビッグデータ時代のデータベース
trycycle
PRO
0
370
CV_5_3dVision
hachama
0
160
凸最適化からDC最適化まで
santana_hammer
1
310
システム数理と応用分野の未来を切り拓くロードマップ・エンターテインメント(スポーツ)への応用 / Applied mathematics for sports entertainment
konakalab
1
420
My Little Monster
juzishuu
0
190
データマイニング - ウェブとグラフ
trycycle
PRO
0
190
データマイニング - ノードの中心性
trycycle
PRO
0
290
データベース08: 実体関連モデルとは?
trycycle
PRO
0
970
論文紹介 音源分離:SCNET SPARSE COMPRESSION NETWORK FOR MUSIC SOURCE SEPARATION
kenmatsu4
0
350
Featured
See All Featured
Designing for humans not robots
tammielis
254
26k
Navigating Team Friction
lara
190
15k
Testing 201, or: Great Expectations
jmmastey
46
7.7k
Balancing Empowerment & Direction
lara
5
710
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
127
54k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
Context Engineering - Making Every Token Count
addyosmani
8
330
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3k
Designing for Performance
lara
610
69k
Why You Should Never Use an ORM
jnunemaker
PRO
60
9.6k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
Building Flexible Design Systems
yeseniaperezcruz
329
39k
Transcript
わかりやすいパターン認識 第⼀章 パターン認識とは︖
パターン認識の定義 観測されたパターンを予め定められた複数 の概念(class)のうちの⼀つに対応させる 処理
パターン認識の事例 • ⼿書きのアルファベットを26クラスに対応させる • ⾳声データを五⼗⾳や単語に対応させる(⾳声認識) • ⼼電図波形から⼼臓の異常・正常状態を判定 構造化データ、⾮構造化データ(画像・⾃然⾔語・⾳声)に関わらず様々な分 野で「パターン認識」はある。
パターン認識の⼀般的な処理の流れ 1. 前処理 1. ノイズ除去 2. 正規化 2. 特徴抽出 1.
本質的な特徴のみ抽出 3. 識別 1. 辞書と照合 識別 認識
特徴ベクトルと特徴空間 • d個の特徴︓d次元特徴ベクトルx • クラス総数c︓クラス名ωc • 特徴ベクトルのはる空間=特徴空間 • 特徴空間じょうで、特徴ベクトルは、 クラスごとにかたまっているはずで、
それらの塊=クラスタ
⼿書き数字認識の例 (5x5メッシュ2値画像) • 最もシンプルには…225パターン • 中には数字に関係ないものもある – リジェクト領域 • リジェクト領域は2種類
– 「どこにも属さない」と「識別困難」 • 辞書作成は必須。辞書作成⾃体が、識別 処理に他ならないからである
⼿書き数字認識の例 (5x5メッシュ2値画像) • 全パターンは⾮現実的、代表パターンだけを記憶(≒識別辞 書に記録)する⽅法がある。 • 代表パターン=プロトタイプ • 各特徴ベクトルが、どのプロトタイプに最も近いかで判定す ることが多い
(Nearest Neighbor rule︓NN法/最近傍決定則) • より⼀般化すると、k-NN法。最も近いk個のプロトタイプを 選び、k個のうち最も多くが属しているクラスを判定結果とす るやりかた。
特徴空間の分割〜プロトタイプを設定する • 全数記憶⽅式 – 現実のデータをサンプリングし、全体をよく表すパ ターンを(識別のための代表パターンとしての)プ ロトタイプとする⽅式 – 【注】サンプリング結果はすべてを表すものではな い
• プロトタイプ⽅式→k-meansにつながる – 各クラスに対して、⼀つのパターンを選ぶという発 想 – クラスの重⼼位置を選ぶというのは、⾃然=k- means – クラスごとの代表パターン間の垂直⼆等分線(多次 元空間であれば、超平⾯)を決定境界という
終わり