Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DTD_はじめての因子分析_理論とビジネス活用.pdf

Avatar for BrainPad BrainPad
December 18, 2025

 DTD_はじめての因子分析_理論とビジネス活用.pdf

Avatar for BrainPad

BrainPad

December 18, 2025
Tweet

More Decks by BrainPad

Other Decks in Technology

Transcript

  1. ©BrainPad Inc. Strictly Confidential 2 自己紹介 ・経歴: ・ 2013年 医療機器の会社に勤務

    ・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
  2. ©BrainPad Inc. Strictly Confidential 5 因子分析 1. どんなものか? たくさんのデータの背後にある「共通の要因(=因子)」を推定する統計手法です ※詳しくは後述します

    2. どういう時に使えそうか? 教育:生徒の能力にあたる因子を推定 (例:計算が早い、運動が苦手) マーケティング:購買動機にあたる因子を推定 (例:持ち運びやすい、デザインが良い) →次に具体例で考えてみましょう 1. 概要
  3. ©BrainPad Inc. Strictly Confidential 6 • アンケートデータの分析について考えてみます 1. 背景: ・技術者向けの会員制サービスを作っている

    ・この会員の退会率が課題となっており、直接的な要因もはっきりしなかった 2. 実施内容: ・要因を推定するためにユーザー向けアンケートを実施した ・機能性、コストなどの中で「どれが退会の引き金になっているか?」を推定する 1. 概要 → 設定した例 概ね 満足 何か 不満
  4. ©BrainPad Inc. Strictly Confidential 7 • アンケート分析の狙いと手法 • ①どんな回答をした人が退会する? •

    ②退会の決め手となる要因は何か? • アンケート結果と退会の関連性を見たい • 「項目が多岐にわたり傾向が掴みにくい」状態を解消したい 1. 概要 概ね 満足 何か 不満
  5. ©BrainPad Inc. Strictly Confidential 8 • アンケート分析の狙いと手法 • ①どんな回答をした人が退会する? •

    ②退会の決め手となる要因は何か? • アンケート結果と退会の関連性を見たい • 「項目が多岐にわたり傾向が掴みにくい」状態を解消したい 1. 概要 → 因子分析 → クラスタリング
  6. ©BrainPad Inc. Strictly Confidential 14 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング

    Appendix ax1 ax2 fig 描画するための 枠を作る 散布図を作る A~Fを プロットする 上記で決めた 描き方の通りに 描画する
  7. ©BrainPad Inc. Strictly Confidential 15 • 階層的クラスタリング Pythonで書くには? 2. クラスタリング

    Appendix ax1 ax2 fig 結合され方を計算 結合され方で決めた通りに A~Fのラベルや図を 対応させる 上記で決めた描き方通りに 描画する
  8. ©BrainPad Inc. Strictly Confidential 18 • クラスタリングの様子 • 距離を定義し、距離が近いところから順に結合 2.

    クラスタリング オレンジ:退会する人が多め 緑:退会する人は少なめ 結果→
  9. ©BrainPad Inc. Strictly Confidential 19 • クラスタリング結果の解釈 2. クラスタリング オレンジ:退会する人が多め

    緑:退会する人は少なめ オレンジグループ(貢献度,操作性に低い点をつける人)が 退会する傾向にあると推察された →「業務に貢献できていない」「直感的に操作できない」 と感じる人が退会しがちだと考えられる
  10. ©BrainPad Inc. Strictly Confidential 20 • クラスタリング結果の解釈 → 「なぜ?」という要因の分析へ 2.

    クラスタリング オレンジ:退会する人が多め 緑:退会する人は少なめ オレンジグループ(貢献度,操作性に低い点をつける人)が 退会する傾向にあると推察された →「業務に貢献できていない」「直感的に操作できない」 と感じる人が退会しがちだと考えられる なぜ「業務に貢献できていない」「直感的に操作できない」 と感じてしまうのか? そう思わせるのは何が原因なのか? → 因子分析を行うことにした 何か 不満
  11. ©BrainPad Inc. Strictly Confidential 22 • 因子分析 • 観測できる値(観測変数)は、どの因子(潜在変数)から影響を受けているか? 3.

    因子分析 国語の点数 理科の点数 体育の点数 社会の点数 数学の点数 目に見える データ 要因 目に見えない データ 潜在変数 観測変数
  12. ©BrainPad Inc. Strictly Confidential 23 • 因子分析 • 観測できる値(観測変数)は、どの因子(潜在変数)から影響を受けているか? 3.

    因子分析 文系の能力 理系の能力 国語の点数 理科の点数 体育の点数 社会の点数 数学の点数 目に見える データ 目に見えない データ 潜在変数 観測変数
  13. ©BrainPad Inc. Strictly Confidential 24 • 因子分析をビジネスにどう活かすか? • どんな因子(潜在変数)が考えられるかを、観測できる値(アンケートの回答)から探る 3.

    因子分析 〇〇が良い △△がある 1問目の回答 4問目の回答 5問目の回答 2問目の回答 3問目の回答 アンケートの 回答 ユーザー心理 潜在変数 観測変数
  14. ©BrainPad Inc. Strictly Confidential 25 • アンケートデータの説明 3. 因子分析 本サービスは貴社の業務に貢献していますか?

    マニュアルなしでも直感的に操作できますか? サポートの対応に満足していますか? サービスの価格は適切ですか? コンテンツの更新頻度は適切ですか? 掲載されている情報の信頼性は高いですか?
  15. ©BrainPad Inc. Strictly Confidential 28 • 因子分析 Pythonで書くには? 3. 因子分析

    Appendix 2因子のモデルで因子分析を行うモデルを作成する varimax(行列の分散が最大になるような直行回転)を用いて計算する 先程のdataをこのモデルに入れる fa.loadings_で因子負荷行列を計算・出力する この因子負荷行列をDataFrameに入れて表示する
  16. ©BrainPad Inc. Strictly Confidential 29 • 因子分析 3. 因子分析 因子1

    因子2 貢献度 操作性 安い 信頼性 サポート 更新頻度 グラフネットワークで 因子と観測変数を表現できた 因子1,2が どこの値に大きく表れるか わかった
  17. ©BrainPad Inc. Strictly Confidential 30 • 因子1, 因子2って何? 3. 因子分析

    まとめ:因子解釈の例 因子1:情報の価値、情報の品質 因子2:使いやすさ、サービスの品質、UX 因子1 因子2 貢献度 更新頻度 信頼性 操作性 サポート 安い 因子1 因子2 貢献度 操作性 安い 信頼性 サポート 更新頻度 このままだと因子1,2が 何を示しているのか わかりづらい 情報価値 使いやすさ
  18. ©BrainPad Inc. Strictly Confidential 33 • クラスター分析、因子分析の結果を総合して考えると? 4. おわりに 結論:

    会員番号0,1,3の3名は貢献度や操作性に満足できていない? 今後は情報の価値や使いやすさを中心に向上を図るなどして改善できるのでは?
  19. ©BrainPad Inc. Strictly Confidential 34 まとめ • 階層的クラスタリングで退会する人しない人の傾向を掴めた • 因子分析でなぜ退会するのか、要因の推定・解釈ができた

    今後の展望 統計的な観点から • 他の属性や他の解釈も行うことで、新しい因子を発見できないか検討する(LLM併用など) 4. おわりに
  20. ©BrainPad Inc. Strictly Confidential 35 今後の展望 データエンジニアリング的な観点から • 他の属性も扱うには、どのようにデータを整備すべきか? •

    → アンケートデータ、人事データのように 担当者が使いやすいようにデータを分けておく 4. おわりに 人事データとアンケートデータが混在 表記ゆれが多い 合計のような計算結果はいらない 取り出してすぐ使える!