Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DTD_はじめての因子分析_理論とビジネス活用.pdf
Search
BrainPad
December 18, 2025
Technology
0
9
DTD_はじめての因子分析_理論とビジネス活用.pdf
BrainPad
December 18, 2025
Tweet
Share
More Decks by BrainPad
See All by BrainPad
【採用候補者向け】BrainPad AAAご紹介資料
brainpadpr
0
620
DTD_TensorRTを用いた自然言語処理モデルの高速化
brainpadpr
0
7
DTD_生成AIアシスタントのコスト最適化
brainpadpr
1
130
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
560
三田データ_BrainPadAAA_AIエージェント元年を振り返る
brainpadpr
1
160
DTD_メタデータ管理とデータ品質管理の具体化
brainpadpr
0
170
DTD_これから始めるMCP基本のキ
brainpadpr
2
240
DTD_大規模開発を加速するAI活用術
brainpadpr
0
77
綺麗なデータマートをつくろう_データ整備を前向きに考える会 / Let's create clean data mart
brainpadpr
3
930
Other Decks in Technology
See All in Technology
ゼロから始めたFindy初のモバイルアプリ開発
grandbig
2
100
Hardware/Software Co-design: Motivations and reflections with respect to security
bcantrill
1
260
The Engineer with a Three-Year Cycle
e99h2121
0
160
AI時代にあわせたQA組織戦略
masamiyajiri
5
2.4k
BPaaSオペレーション・kubell社内 n8n活用による効率化検証事例紹介
kentarofujii
0
290
新規事業 toitta におけるAI 機能評価の話 / AI Feature Evaluation in toitta
pokutuna
0
270
一番人に近いコードレビューア CodeRabbit
kinopeee
0
110
AWSと暗号技術
nrinetcom
PRO
1
170
クラウドセキュリティの進化 — AWSの20年を振り返る
kei4eva4
0
160
Amazon Bedrock AgentCore EvaluationsでAIエージェントを評価してみよう!
yuu551
0
170
3リポジトリーを2ヶ月でモノレポ化した話 / How I turned 3 repositories into a monorepo in 2 months
kubode
0
110
ドメイン駆動セキュリティへの道しるべ
pandayumi
0
180
Featured
See All Featured
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
81
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
SEO for Brand Visibility & Recognition
aleyda
0
4.2k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.9k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
Paper Plane
katiecoart
PRO
0
46k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
58
42k
Bash Introduction
62gerente
615
210k
HDC tutorial
michielstock
1
330
Mobile First: as difficult as doing things right
swwweet
225
10k
Transcript
はじめての因子分析 理論とビジネス活用 2025年 12月18日
©BrainPad Inc. Strictly Confidential 2 自己紹介 ・経歴: ・ 2013年 医療機器の会社に勤務
・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
©BrainPad Inc. Strictly Confidential 3 自己紹介 • 今回は統計学のお話になります • 統計学で最近勉強した因子分析関連の話に焦点を置いて話します
• 理論の部分は数式が難しいので、流れなどを中心に説明できればと思います
1. 概要 2. クラスタリング 3. 因子分析 4. おわりに
©BrainPad Inc. Strictly Confidential 5 因子分析 1. どんなものか? たくさんのデータの背後にある「共通の要因(=因子)」を推定する統計手法です ※詳しくは後述します
2. どういう時に使えそうか? 教育:生徒の能力にあたる因子を推定 (例:計算が早い、運動が苦手) マーケティング:購買動機にあたる因子を推定 (例:持ち運びやすい、デザインが良い) →次に具体例で考えてみましょう 1. 概要
©BrainPad Inc. Strictly Confidential 6 • アンケートデータの分析について考えてみます 1. 背景: ・技術者向けの会員制サービスを作っている
・この会員の退会率が課題となっており、直接的な要因もはっきりしなかった 2. 実施内容: ・要因を推定するためにユーザー向けアンケートを実施した ・機能性、コストなどの中で「どれが退会の引き金になっているか?」を推定する 1. 概要 → 設定した例 概ね 満足 何か 不満
©BrainPad Inc. Strictly Confidential 7 • アンケート分析の狙いと手法 • ①どんな回答をした人が退会する? •
②退会の決め手となる要因は何か? • アンケート結果と退会の関連性を見たい • 「項目が多岐にわたり傾向が掴みにくい」状態を解消したい 1. 概要 概ね 満足 何か 不満
©BrainPad Inc. Strictly Confidential 8 • アンケート分析の狙いと手法 • ①どんな回答をした人が退会する? •
②退会の決め手となる要因は何か? • アンケート結果と退会の関連性を見たい • 「項目が多岐にわたり傾向が掴みにくい」状態を解消したい 1. 概要 → 因子分析 → クラスタリング
©BrainPad Inc. Strictly Confidential クラスタリング
©BrainPad Inc. Strictly Confidential 10 • クラスタリング:データをいくつかのグループ(クラスター)に分類する手法 データ同士の類似度に基づいて分類するので、正解データを使わない • 特徴:k-means法のように、事前にグループ数を決める手法もある
2. クラスタリング クラスター 3種で分類
©BrainPad Inc. Strictly Confidential 11 • 階層的クラスタリング • クラスター数を事前に決めなくて良い→多様な解釈が可能 2.
クラスタリング 2つのクラスターとして解釈できる
©BrainPad Inc. Strictly Confidential 12 • 階層的クラスタリング • クラスター数を事前に決めなくて良い→多様な解釈が可能 2.
クラスタリング 4つのクラスターとして解釈できる
©BrainPad Inc. Strictly Confidential 13 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix
©BrainPad Inc. Strictly Confidential 14 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix ax1 ax2 fig 描画するための 枠を作る 散布図を作る A~Fを プロットする 上記で決めた 描き方の通りに 描画する
©BrainPad Inc. Strictly Confidential 15 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング
Appendix ax1 ax2 fig 結合され方を計算 結合され方で決めた通りに A~Fのラベルや図を 対応させる 上記で決めた描き方通りに 描画する
©BrainPad Inc. Strictly Confidential 17 • アンケートデータの説明 2. クラスタリング ・
・ ・
©BrainPad Inc. Strictly Confidential 18 • クラスタリングの様子 • 距離を定義し、距離が近いところから順に結合 2.
クラスタリング オレンジ:退会する人が多め 緑:退会する人は少なめ 結果→
©BrainPad Inc. Strictly Confidential 19 • クラスタリング結果の解釈 2. クラスタリング オレンジ:退会する人が多め
緑:退会する人は少なめ オレンジグループ(貢献度,操作性に低い点をつける人)が 退会する傾向にあると推察された →「業務に貢献できていない」「直感的に操作できない」 と感じる人が退会しがちだと考えられる
©BrainPad Inc. Strictly Confidential 20 • クラスタリング結果の解釈 → 「なぜ?」という要因の分析へ 2.
クラスタリング オレンジ:退会する人が多め 緑:退会する人は少なめ オレンジグループ(貢献度,操作性に低い点をつける人)が 退会する傾向にあると推察された →「業務に貢献できていない」「直感的に操作できない」 と感じる人が退会しがちだと考えられる なぜ「業務に貢献できていない」「直感的に操作できない」 と感じてしまうのか? そう思わせるのは何が原因なのか? → 因子分析を行うことにした 何か 不満
©BrainPad Inc. Strictly Confidential 因子分析
©BrainPad Inc. Strictly Confidential 22 • 因子分析 • 観測できる値(観測変数)は、どの因子(潜在変数)から影響を受けているか? 3.
因子分析 国語の点数 理科の点数 体育の点数 社会の点数 数学の点数 目に見える データ 要因 目に見えない データ 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 23 • 因子分析 • 観測できる値(観測変数)は、どの因子(潜在変数)から影響を受けているか? 3.
因子分析 文系の能力 理系の能力 国語の点数 理科の点数 体育の点数 社会の点数 数学の点数 目に見える データ 目に見えない データ 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 24 • 因子分析をビジネスにどう活かすか? • どんな因子(潜在変数)が考えられるかを、観測できる値(アンケートの回答)から探る 3.
因子分析 〇〇が良い △△がある 1問目の回答 4問目の回答 5問目の回答 2問目の回答 3問目の回答 アンケートの 回答 ユーザー心理 潜在変数 観測変数
©BrainPad Inc. Strictly Confidential 25 • アンケートデータの説明 3. 因子分析 本サービスは貴社の業務に貢献していますか?
マニュアルなしでも直感的に操作できますか? サポートの対応に満足していますか? サービスの価格は適切ですか? コンテンツの更新頻度は適切ですか? 掲載されている情報の信頼性は高いですか?
©BrainPad Inc. Strictly Confidential 26 • アンケートデータを用いて 因子分析を実施してみる 3. 因子分析
標準化 行列計算
©BrainPad Inc. Strictly Confidential 27 • 因子分析 Pythonで書くには? 3. 因子分析
Appendix
©BrainPad Inc. Strictly Confidential 28 • 因子分析 Pythonで書くには? 3. 因子分析
Appendix 2因子のモデルで因子分析を行うモデルを作成する varimax(行列の分散が最大になるような直行回転)を用いて計算する 先程のdataをこのモデルに入れる fa.loadings_で因子負荷行列を計算・出力する この因子負荷行列をDataFrameに入れて表示する
©BrainPad Inc. Strictly Confidential 29 • 因子分析 3. 因子分析 因子1
因子2 貢献度 操作性 安い 信頼性 サポート 更新頻度 グラフネットワークで 因子と観測変数を表現できた 因子1,2が どこの値に大きく表れるか わかった
©BrainPad Inc. Strictly Confidential 30 • 因子1, 因子2って何? 3. 因子分析
まとめ:因子解釈の例 因子1:情報の価値、情報の品質 因子2:使いやすさ、サービスの品質、UX 因子1 因子2 貢献度 更新頻度 信頼性 操作性 サポート 安い 因子1 因子2 貢献度 操作性 安い 信頼性 サポート 更新頻度 このままだと因子1,2が 何を示しているのか わかりづらい 情報価値 使いやすさ
©BrainPad Inc. Strictly Confidential 4. おわりに
©BrainPad Inc. Strictly Confidential 32 クラスター分析、因子分析の 内容を踏まえて…
©BrainPad Inc. Strictly Confidential 33 • クラスター分析、因子分析の結果を総合して考えると? 4. おわりに 結論:
会員番号0,1,3の3名は貢献度や操作性に満足できていない? 今後は情報の価値や使いやすさを中心に向上を図るなどして改善できるのでは?
©BrainPad Inc. Strictly Confidential 34 まとめ • 階層的クラスタリングで退会する人しない人の傾向を掴めた • 因子分析でなぜ退会するのか、要因の推定・解釈ができた
今後の展望 統計的な観点から • 他の属性や他の解釈も行うことで、新しい因子を発見できないか検討する(LLM併用など) 4. おわりに
©BrainPad Inc. Strictly Confidential 35 今後の展望 データエンジニアリング的な観点から • 他の属性も扱うには、どのようにデータを整備すべきか? •
→ アンケートデータ、人事データのように 担当者が使いやすいようにデータを分けておく 4. おわりに 人事データとアンケートデータが混在 表記ゆれが多い 合計のような計算結果はいらない 取り出してすぐ使える!
株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp
[email protected]
本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.