Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI×データ活用実践ノウハウ。埋もれたデータを“使える資産”に変えるには?

NCDC
March 28, 2025

 AI×データ活用実践ノウハウ。埋もれたデータを“使える資産”に変えるには?

AIの進化に伴い、企業におけるデータ収集・活用の重要性はますます高まっています。しかし、収集したデータを十分に活用できていないケースは多く、当社にもその活用方法について多くのご相談が寄せられています。

本セミナーでは、当社が実際に担当した建設業や製造業におけるデータ分析プロジェクトや、他業界での有名なデータ活用の事例を取り上げ、データによって解決できる課題の具体例からデータ活用の方法までわかりやすく解説します。

主な内容
・有名なデータ収集の事例紹介
・収集したデータを活用できていないケースの問題点と解決法
・当社が担当したデータ活用プロジェクトの実際(建設業、製造業)

こんな方におすすめ
・手元にあるデータの活用方法を模索している方
・データ活用の具体的な進め方に課題を感じている方
・データ分析やAI活用の相談先を探している方

NCDC

March 28, 2025
Tweet

More Decks by NCDC

Other Decks in Business

Transcript

  1. 本日のテーマ l AI×データ活用実践ノウハウ l データの活用によって「競争上の優位性を確立すること」は、DXのコアです が、必ずしも多くの企業でデータ活用が順調に進んでいるわけではない l 「企業がビジネス環境の激しい変化に対応し、データとデジタル技術を活用して、 顧客や社会のニーズを基に、製品やサービス、ビジネスモデルを変革するととも に、業務そのものや、組織、プロセス、企業文化・風土を変革し、競争上の優位性

    を確立すること」 l 経済産業省デジタル・ガバナンスコード (https://www.meti.go.jp/policy/it_policy/investment/dx-chushoguidebook/tebiki2-0.pdf) より抜粋 l 本セミナーでは「データはあるけれど活用できない・活用方法が分からない」 という状況に着目し、溜まっているデータをAIでいかに活用するかを解説 します 4
  2. AIを使うために必要なこと l AIを使うためには、「テーマ」「使えるデータ」「AIを使える環境」が揃って いることが必要です l また、AIを使って生成した推論モデルを使ってもらうには、推論根拠が明 確・正確であることが求められます l これらの疑問に対して、①〜④の順にご説明します 6

    せっかくデータも溜まってきていることだし、 AI使って 何かしてよ 確かにデータ は溜まっている けれど、 使えるの? AIって そんな簡単に 使えるの? 何をすれば 良いの? 何かできたら みんな使って くれるの? ① テーマを設定 する ② AI活用環境を 準備する ③ 使えるデータを 準備する ④ AIの推論根拠を 可視化する
  3. 分析テーマを設定するヒント l 業務の中で課題を感じたり、やりたいことを見つけたりすることは 多くあると思います l ポイントは、課題ややりたいことが「今あるデータを活用して解決/実現 できるか」です l この点を吟味して分析を前に進めるには、「やりたいことが手元のデータ でできるか」と「手元のデータからできることは何か」の双方向で検討を

    することが有効です 9 売上や需要を予測して、 在庫を最適化したい 不良品を検知したい 施工中のトラブルを 予測したい ユーザーアンケートを 要約して分析したい 機械の振動や 音のデータ テキストデータ 解決したい課題・ 実現したいことは何? テーブルデータ 画像データ 手元にあるのは どんなデータ? 課題からとデータから、双方向でアプローチしてテーマを決める
  4. 分析テーマ設定の例 l 病院における画像診断 10 病変を検知したい 解決したい課題・ 実現したいことは何? 画像データ (レントゲン・MRI) 手元にあるのは

    どんなデータ? 課題・やりたいこと • 経験の浅い医師が病変を見逃し、重大な誤診につながることを避けたい • 診断にかかる時間を短縮し、患者への診断結果通知を速やかに行いたい • ベテラン医師の知見を、効率よく次世代に伝承していきたい データ • レントゲンやMRI等、診断するための画像は大量に蓄積されている • カルテの情報も電子化されつつある テーマ • 画像を用いて「病変がどのように画像に現れるか」をAIに学習させ、診断に活用 する テーブルデータ (患者の情報) 過去の病歴や生活習慣が、 診断の一助になる
  5. 分析テーマ設定の例 l 金融機関における与信審査 11 与信審査を 自動化したい テキストデータ 解決したい課題・ 実現したいことは何? 顧客属性データ

    与信結果データ 手元にあるのは どんなデータ? 課題・やりたいこと • 与信の審査には時間がかかり、融資業務のボトルネックになっている • 審査にかかる時間を短縮し、行える融資は速やかに行いたい • リスクを見逃さず、審査ミスによる融資の焦げつきを減らしたい データ • これまでの審査データは大量に保存されている • どんな属性の人がいくらの融資を申請し、承認したか・しなかったか テーマ • 顧客の属性情報と審査承認の有無をAIに学習させ、与信審査を自動化する 備考やメモをテキスト解析 したら役に立つかも
  6. 分析テーマ設定の例 l 建設業における施工管理 12 施工ノウハウを共有知化 したい テキストデータ 解決したい課題・ 実現したいことは何? テーブルデータ

    手元にあるのは どんなデータ? 課題・やりたいこと • 現場や担当者によって、工事の品質に差がある • 工事品質を向上させるノウハウを次世代に伝えていきたいが、ノウハウが属人化 している データ • これまで自社で担当してきた工事の結果を記録したデータはある • 定量的なデータだけでなく、備考欄に書かれた記録のようなテキストデータ も存在する テーマ • 施工品質と合わせて工事の属性(地点・工法・その他諸条件)をAIに学習させ、 属人的なノウハウの抽出を試みる 施工ポイントはメモして ある可能性が高い
  7. AI活用環境を手軽に用意できるサービス l 「AI活用環境を準備すること」のハードルは、実はあまり高くありません l 「ひとまず試してみる」ことも十分可能です l 三大クラウドベンダーはそれぞれに機械学習サービスを用意していて、少々 の準備でサービスを利用することができます l AmazonSageMaker/Google

    Auto ML/Auzre Machine Learning l これらのサービスではMLOpsまで対応が可能 l 手元で少し動かしてみたいだけなら、「Anaconda」や「KNIME」がおすすめ l https://www.anaconda.com/ l https://knime-infocom.jp/ l いずれのサービスも、多様なアルゴリズムを使えるようになっており、 ニーズに合わせてモデリング方法を選択できます 15
  8. l クレンジングや特徴量生成、データの可視化、AIによるモデリング等、 GUIでフローを組むことで実施できます l 上記の基本的な機能は無料で利用できます l データベース接続等をしなければ、スタンドアロンのPCでも動作します l 特殊な環境は不要です l

    ExcelやCSV、テキストファイルの読み書きにも対応しています l 日本語に対応していない点がネックですが、「プロジェクト本格開始前に まずは自分でお試ししてみたい」という場合に有効です 知っていて損のないデータ分析のツール「KNIME(ナイム)」 16 https://knime-infocom.jp/service/knime-analytics-platform/ より抜粋
  9. l データの準備で行われる代表的な手続きをご説明します l 欠損の除去・補完 l 0で埋める/平均値で埋める/中央値で埋める/レコード自体を除去する等、 各々の項目に対して最適な方法を検討し、処理します l 外れ値の除去 l

    何を以て外れ値とするか?外れ値は除去する必要があるか?を検討し、 必要な処理を実施します l カテゴリー型変数のダミー化 l 機械が判読しづらいカテゴリーデータをフラグ変換します l いずれも、簡単なコードやGUIによる処理フローの作成で実装ができます データの準備の実例 21 製品 カテゴリ にんじん 野菜 ねぎ 野菜 コーヒー 飲料 歯ブラシ 日用品 名前 野菜 飲料 日用品 にんじん 1 0 0 ねぎ 1 0 0 コーヒー 0 1 0 歯ブラシ 0 0 1
  10. AIの推論根拠が見えないと・・・ l AIアルゴリズム基本的にブラックボックスで、推論根拠が分かりません l 根拠が分からない結果、重大な問題が発生することもあります l AIの推論根拠が不明だった結果発生した重大事案の例 l 重大な事案に繋がらなくとも、せっかく作った推論モデルが実務の現場で使って もらえない、という状況が発生します

    l 「確かに予測としては妥当であるが、信頼できない」 24 分野 事例 ポイント 医療 • AIによる画像診断においてAIが特定の病 変を検出したがその根拠が不明確で、医師 が診断結果を信頼できず手術に踏み切れ なかった • 実際には摘出すべき病変であり、結果的に 治療の遅れに繋がった • AIは誤った特徴を学習してしまい、本来注 目すべき病変を見落としている可能性も 持っている • 推論根拠を明確にすることで、AIの誤った 学習にも気づけるし、根拠が正しければ迅 速な治療にも繋がる 金融 • AIによる与信審査において融資不可と審査 されたが、その理由が不明確で、申請者は 納得することができなかった • 後日、AIは申請者が女性であることを審査 根拠としていたことが分かった • AIは特定の属性(人種、性別など)に基づ いて不当な判断を下してしまう可能性もあり、 結果として差別や不公平な扱いに繋がりか ねない
  11. l SHAPでは、テストデータ全体の推論傾向を可視化することも、 個別のテストデータの推論根拠を可視化することもできます l 下図は、全体の推論傾向を可視化した事例です l 「女性」「高級クラス」「年齢が若い」ほど生存確率が高い、と推論したことが 読み取れます SHAPによる可視化事例 26

    「生存した」と予測する方 向に作用 「死亡した」と予測する方 向に作用 影 響 力 料金 年齢 チケットクラス 性別 子供の人数 乗船した港 同乗している兄弟/配偶者数 変 数 の 値 SHAPによるSummary_Plotの事例(KaggleのTitanicデータを使用) https://recruit.cct-inc.co.jp/wp-content/uploads/2019/01/treeshap_summary.png
  12. SHAPによる可視化事例 l 下図は、個別のテストデータの推論根拠を可視化した事例です l 性別が男性であることとチケットのクラスが低いことが生存者である確率を 下げているものの、年齢が9歳(子供)であることが生存者である確率を大きく 押し上げています l カテゴリ変数の凡例 27

    Value Pclass(チケットクラス) 1 高級 2 中級 3 下級 Value Embarked(乗船した港) -1 Cherbourg(フランス) 0 Queenstown(アイルランド) 1 Southampton(イングランド) Value Sex(性別) 0 female 女性 1 male 男性 https://recruit.cct-inc.co.jp/wp-content/uploads/2019/01/treeshap_force.png https://recruit.cct-inc.co.jp/tecblog/machine-learning/shap/ より抜粋して作成 兄弟・子供 0人 9歳 男性 下級 チケット
  13. まとめ l AIを使うためには「テーマ」「使えるデータ」「AIを使える環境」が揃ってい ることが必要ですが、これらは皆様が整えることも十分可能です l テーマは「やりたいこと/解決したいこと」と「データ」の双方から考えます l AnacondaやKNIMEといったデータ分析ツールを導入すれば、データの加工 からAIを使った推論まで、簡単に実施することができます l

    AIの推論根拠を明確化して業務との照らし合わせをすることで、AIに対 する信頼性を高め、活用を促進することができます l 推論根拠の明確化については少しハードルが高いかと思いますので、社内 の詳しい方や外部のコンサルタント・データサイエンティスト等にご相談いた だくのが良いでしょう 30