Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
わかりやすいパターン認識1章 / Pattern Recognition Manual Eas...
Search
masso
December 05, 2020
Science
0
160
わかりやすいパターン認識1章 / Pattern Recognition Manual Easy to understand SS 01
わかりやすいパターン認識のセルフ輪読会資料〜第一章
masso
December 05, 2020
Tweet
Share
More Decks by masso
See All by masso
Stacktrace for rs/zerolog users
masso
0
240
データ解釈学入門 第一部 / Data hermeneutics Part 1
masso
8
2.1k
時系列分析と状態空間モデリングの基礎 / Foundations of Time Series Analysis and State Space Models 0
masso
0
570
わかりやすいパターン認識2章 / Pattern Recognition Manual Easy to understand SS 02
masso
0
890
分析環境紹介LT / the introduction of as my analysis env is
masso
0
110
データ解析のための統計モデリング入門6章 / Handbook-of-statistical-modeling-for-data-analysis-section6
masso
0
520
DLGが目指すコミュニティの形 / DLG Community Objective
masso
0
2.5k
PowerAutomateによる社員健康状態集計システム / Employee health status tabulation system with Power Automate
masso
0
1.5k
Other Decks in Science
See All in Science
トラブルがあったコンペに学ぶデータ分析
tereka114
2
1.5k
創薬における機械学習技術について
kanojikajino
16
5.1k
3次元点群を利用した植物の葉の自動セグメンテーションについて
kentaitakura
2
1k
07_浮世満理子_アイディア高等学院学院長_一般社団法人全国心理業連合会代表理事_紹介資料.pdf
sip3ristex
0
250
マテリアルズ・インフォマティクスの先端で起きていること / What's Happening at the Cutting Edge of Materials Informatics
snhryt
1
210
重複排除・高速バックアップ・ランサムウェア対策 三拍子そろったExaGrid × Veeam連携セミナー
climbteam
0
220
The Incredible Machine: Developer Productivity and the Impact of AI
tomzimmermann
0
600
【健康&筋肉と生産性向上の関連性】 【Google Cloudを企業で運用する際の知識】 をお届け
yasumuusan
0
510
Transformers are Universal in Context Learners
gpeyre
0
770
All-in-One Bioinformatics Platform Realized with Snowflake ~ From In Silico Drug Discovery, Disease Variant Analysis, to Single-Cell RNA-seq
ktatsuya
0
330
解説!データ基盤の進化を後押しする手順とタイミング
shomaekawa
1
420
04_石井クンツ昌子_お茶の水女子大学理事_副学長_D_I社会実現へ向けて.pdf
sip3ristex
0
260
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.3k
Raft: Consensus for Rubyists
vanstee
137
6.8k
How to Ace a Technical Interview
jacobian
276
23k
How STYLIGHT went responsive
nonsquared
99
5.4k
Imperfection Machines: The Place of Print at Facebook
scottboms
267
13k
Building Your Own Lightsaber
phodgson
104
6.3k
Side Projects
sachag
452
42k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Making the Leap to Tech Lead
cromwellryan
133
9.2k
Designing Experiences People Love
moore
141
23k
Transcript
わかりやすいパターン認識 第⼀章 パターン認識とは︖
パターン認識の定義 観測されたパターンを予め定められた複数 の概念(class)のうちの⼀つに対応させる 処理
パターン認識の事例 • ⼿書きのアルファベットを26クラスに対応させる • ⾳声データを五⼗⾳や単語に対応させる(⾳声認識) • ⼼電図波形から⼼臓の異常・正常状態を判定 構造化データ、⾮構造化データ(画像・⾃然⾔語・⾳声)に関わらず様々な分 野で「パターン認識」はある。
パターン認識の⼀般的な処理の流れ 1. 前処理 1. ノイズ除去 2. 正規化 2. 特徴抽出 1.
本質的な特徴のみ抽出 3. 識別 1. 辞書と照合 識別 認識
特徴ベクトルと特徴空間 • d個の特徴︓d次元特徴ベクトルx • クラス総数c︓クラス名ωc • 特徴ベクトルのはる空間=特徴空間 • 特徴空間じょうで、特徴ベクトルは、 クラスごとにかたまっているはずで、
それらの塊=クラスタ
⼿書き数字認識の例 (5x5メッシュ2値画像) • 最もシンプルには…225パターン • 中には数字に関係ないものもある – リジェクト領域 • リジェクト領域は2種類
– 「どこにも属さない」と「識別困難」 • 辞書作成は必須。辞書作成⾃体が、識別 処理に他ならないからである
⼿書き数字認識の例 (5x5メッシュ2値画像) • 全パターンは⾮現実的、代表パターンだけを記憶(≒識別辞 書に記録)する⽅法がある。 • 代表パターン=プロトタイプ • 各特徴ベクトルが、どのプロトタイプに最も近いかで判定す ることが多い
(Nearest Neighbor rule︓NN法/最近傍決定則) • より⼀般化すると、k-NN法。最も近いk個のプロトタイプを 選び、k個のうち最も多くが属しているクラスを判定結果とす るやりかた。
特徴空間の分割〜プロトタイプを設定する • 全数記憶⽅式 – 現実のデータをサンプリングし、全体をよく表すパ ターンを(識別のための代表パターンとしての)プ ロトタイプとする⽅式 – 【注】サンプリング結果はすべてを表すものではな い
• プロトタイプ⽅式→k-meansにつながる – 各クラスに対して、⼀つのパターンを選ぶという発 想 – クラスの重⼼位置を選ぶというのは、⾃然=k- means – クラスごとの代表パターン間の垂直⼆等分線(多次 元空間であれば、超平⾯)を決定境界という
終わり