Upgrade to Pro — share decks privately, control downloads, hide ads and more …

事業会社の技術を支えるR&D部署から見たKDD2025

Avatar for Shinya Yaku Shinya Yaku
September 10, 2025

 事業会社の技術を支えるR&D部署から見たKDD2025

アカデミアと事業会社でAI技術トレンドを話し合う会 (2025/09/10)
https://dentsusokenai01.peatix.com/

Avatar for Shinya Yaku

Shinya Yaku

September 10, 2025
Tweet

More Decks by Shinya Yaku

Other Decks in Research

Transcript

  1. 自己紹介: 夜久真也 (Yaku Shinya) 趣味 クラフトビール (主に Hazy IPA) KDD開催地トロントで飲んだものの一部→

    経歴 2013年 東京大学 工学部 計数工学科 システム情報工学コース 卒業 2015年 東京大学大学院 情報理工学系研究科 システム情報学専攻 修了 2015年 ヤフー株式会社 入社 (現職、2023年10月よりLINEヤフー株式会社) 業務歴 2015~2021: ビッグデータ・機械学習エンジニア サジェスト・関連検索ワード・一発回答意図解釈 etc. Yahoo!検索 etc. 2021~現在: データサイエンティスト 中央組織でプロダクトや人事施策の効果検証・分析アルゴリズム開発 etc. LINE公式アカウント、PayPayギフト(Yahoo!セールスプロモーション)、
 Yahoo!しごとカタログ etc.
  2. そもそもKDDはどんな立ち位置の国際会議か? 出典:https://www.kamishima.net/soft/ (ML, DM, and AI Conference Map) セッション名の例 Graph

    Neural Networks Recommender Systems Spatio-Temporal Modeling Machine Learning Optimization Federated Learning Trajectory Modeling and Analysis Advertising ... KDDはデータマイニング・AI・(機械学習)分野
 のトップレベルのカンファレンス(*) (*) CORE2023 A* Rank (上位7.65%以上)
  3. 現在の主な業務とKDDとの関わり(1) 人事多面評価のバイアス除去 (人事ドメイン・バイアス除去アルゴリズム開発) 企業内で行われる多面評価(360度評価)の評価者の甘辛を補正した評点を
 算出するアルゴリズムを開発中。
 「Digital HR Competition 2024」 ピープルアナリティクス部門グランプリ[2]、


    「第10回 HRテクノロジー大賞」 アナリティクス部門優秀賞受賞[3]。 このアルゴリズムについての論文を
 KDD 2025 (Applied Data Science Track) に投稿したが、
 査読の結果Rejectとなった。 Machine Learning Drift and Bias Detection Data Science for Business Processes Algorithmic Fairness The 6th International Workshop on Talent and Management Computing (Workshop) 以下の ようなセッションが参考になりそう! [1 ] 360 度評価における 評価者ごとの バイアスを 除去する 新手法を開発 ―LI NEヤフー https://project.nikkeibp.co.jp/HumanCapital/atcl/column/00066/121600014/ [2] LI NEヤフー「 360 度評価における バイアス 除去技術」が グランプリ ―Digital HR Competition https://project.nikkeibp.co.jp/HumanCapital/atcl/column/00014/110800053/ [3] 第10回 HRテクノロジー大賞 https://www.hrpro.co.jp/award/technology/ プロジ ェク ト説明記事 [1 ] より引用
  4. 現在の主な業務とKDDとの関わり(2) Off-Policy Evaluation (OPE) (因果推論・機械学習性能評価) Causal Inference and Discovery Causal

    Discovery and Domain Adaptation 3rd Workshop on Causal Inference and Machine Learning in Practice (Workshop) 新たなポリシー (機械学習モデル、ルールベースロジック、etc .) を オンラインにデプロイする前に、その性能を既存のログデータから評価したい。 しかし、ログデータからはデプロイ済のアルゴリズムに対するユーザーの
 行動しか得られないため、単純な集計ではバイアスが乗ってしまう。 OPEは、このようなバイアスを除去しながら、
 新たなポリシーの性能をできるだけ精緻にオフライン推定する。 現在はLINEヤフープロダクトのとある施策に対してOPEの技術検証を
 しており、今後様々なプロダクトにも横展開することを計画中。 以下のようなセッションが参考になりそう! 実際に
 起きたこと 反実仮想 機械学習
 システムの
 レコメンド ユーザーの
 行動結果 購入せず… 購入した! 購入せず… ログデータで
 観測できている ログデータで
 観測できていない
  5. 人事多面評価のバイアス除去関連の動向 (1) Workshop: The 6th International Workshop on Talent and

    Management Computing 前身のO B TA2 0 18から 数える とKDDで 7 回目に開催された 、 人事データ活用関連のワーク ショップ この 分野 のコミュニ テ ィでは中心的な 役 割を担ってい る と思われ る W eb Page に掲載されてい る ト ピッ クは 非 常に多岐にわたってい る 経 営 科学のためのAI 、イ ンテ リ ジェント な 経 営 情報シ ス テム 、 マルチエージェントシ ス テム 、 求人推薦と イ ンテ リ ジェント な 採用 、 個人と仕 事 の 適 合 性 と仕 事 の 満 足度 、キ ャ リ ア開発とパ ス モデ リ ン グ、 プロフェ ッ ショナルソーシャルネ ッ トワーク 、才 能行動モデ リ ン グ、才 能 、 個 性、リ ーダーシ ッ プ 、人 材 パフ ォ ー マ ン ス 評 価 、 人材の維持と イ ンセンティブ 、 チーム 編 成とタ ス ク割り当て 、グ ループ ベ ー ス の意思決 定、 組織の変化と安 定性、 組織文化とコ ミ ュニケーション 、 組織競 争 分析 、 労働 市 場情報 、 戦略的管理と計 画、 人材と管理コン ピ ューティン グ に おけ る 公平 性、LL M ベ ー ス の人材管理シ ス テム 、 科学 ビッグ データと技術的 才 能 論文発表は4件 (N o Sh o w 1件) Li nkedInデータの大学・企 業 の キ ャ リ ア変遷 グラ フから大学の影響力を評価 ( ラ トガー ス 大学, BOSS Zh ipi n 他) 人 事 関連PDFの 画像 やテ キス トから LL Mで情報抽出 (Amaz o n) 企 業 内の専門家の知識を統一的 な オントロジー (概念同士の関係 性 ) に LL Mで変換 (Amaz o n) 求職 者 のプロフィール写真の 服 装と採用可否の関連 性 の分析 ( 中 国科学技術大学) 参加 者 は10~20人程度の 規 模で 、 他のワークショ ッ プやセ ッ ションと比 較 す る と少 な め W e b P ag e : h ttps://tmc w or k s h op.git h ub.io/ 202 5/
  6. 人事多面評価のバイアス除去関連の動向 (1) Workshop: The 6th International Workshop on Talent and

    Management Computing 前身 のOBTA2018から数えるとKDDで7回目に開催された、人事データ活用関連のワークショップ この分野のコミュニティでは中心的な役割を担っていると思われる Web Pageに掲載されているトピックは非常に多岐にわたっている 経営科学のためのAI、インテリジェントな経営情報システム、マルチエージェントシステム、求人推薦とインテリジェントな採用、個人と仕 事の適合性と仕事の満足度、キャリア開発とパスモデリング、プロフェッショナルソーシャルネットワーク、才能行動モデリング、才能、個 性、リーダーシップ、人材パフォーマンス評価、人材の維持とインセンティブ、チーム編成とタスク割り当て、グループベースの意思決定、 組織の変化と安定性、組織文化とコミュニケーション、組織競争分析、労働市場情報、戦略的管理と計画、人材と管理コンピューティングに おける公平性、LLMベースの人材管理システム、科学ビッグデータと技術的才能 論文発表は4件 (No Show 1件) LinkedInデータの大学・企業のキャリア変遷グラフから大学の影響力を評価 (ラトガース大学, BOSS Zhipin 他) 人事関連PDFの画像やテキストからLLMで情報抽出 (Amazon) 企業内の専門家の知識を統一的なオントロジー (概念同士の関係性) にLLMで変換 (Amazon) 求職者のプロフィール写真の服装と採用可否の関連性の分析 (中国科学技術大学) 参加者は10~20人程度の規模で、他のワークショップやセッションと比較すると少なめ Ye, Yuyang, et al. "University evaluation through graduate employment prediction: An influence based graph autoencoder approach." IEEE Transactions on Knowledge and Data Engineering 36.11 (2024): 7255-7267. Web Page: https://tmcworkshop.github.io/2025/
  7. 人事多面評価のバイアス除去関連の動向 (1) Workshop: The 6th International Workshop on Talent and

    Management Computing 前身 のOBTA2018から数えるとKDDで7回目に開催された、人事データ活用関連のワークショップ この分野のコミュニティでは中心的な役割を担っていると思われる Web Pageに掲載されているトピックは非常に多岐にわたっている 経営科学のためのAI、インテリジェントな経営情報システム、マルチエージェントシステム、求人推薦とインテリジェントな採用、個人と仕 事の適合性と仕事の満足度、キャリア開発とパスモデリング、プロフェッショナルソーシャルネットワーク、才能行動モデリング、才能、個 性、リーダーシップ、人材パフォーマンス評価、人材の維持とインセンティブ、チーム編成とタスク割り当て、グループベースの意思決定、 組織の変化と安定性、組織文化とコミュニケーション、組織競争分析、労働市場情報、戦略的管理と計画、人材と管理コンピューティングに おける公平性、LLMベースの人材管理システム、科学ビッグデータと技術的才能 論文発表は4件 (No Show 1件) LinkedInデータの大学・企業のキャリア変遷グラフから大学の影響力を評価 (ラトガース大学, BOSS Zhipin 他) 人事関連PDFの画像やテキストからLLMで情報抽出 (Amazon) 企業内の専門家の知識を統一的なオントロジー (概念同士の関係性) にLLMで変換 (Amazon) 求職者のプロフィール写真の服装と採用可否の関連性の分析 (中国科学技術大学) 参加者は10~20人程度の規模で、他のワークショップやセッションと比較すると少なめ Web Page: https://tmcworkshop.github.io/2025/ 思っていたより参加者が少なかった… 人事データ活用(タレントマネジメント)の領域が広すぎて研究者間で問題意識を共有しづらい? ドメインドリブンではなく、技術ドリブンの集まりのほうがお互い分かりあいやすい? BOSS Zhipin(人材マッチングサービス)のように人事ドメインでビジネスをする企業も参画しているのは特徴的
  8. 人事多面評価のバイアス除去関連の動向 (2) Session: Data Science for Business Processes 自分が投稿した論文がもし採択されていたら、ここで発表していたかも? 発表は6件

    A/Bテスト前にKPIに及ぼす影響を、ログデータから数理最適化することでオフライン推定 (Spotify) 金融リスクガバナンスのための、企業のステークホルダーグラフから実質的支配者を推定 (武漢大学) 機械学習プロダクトの成熟度レベルの提案と、一部の指標測定の自動化 (Booking.com) バスケットボールチームの崩壊を、精神的な潜在状態の推定をもとに分析 (ボストン大学 他) クラウドサービスのインシデントで、LLMでトラブルシューティングワークフローを自動生成 (南開大学、Huawei Cloud 他) クラウドインフラのメモリエラーを、メモリアーキテクチャの階層構造を考慮しながら予測 (中国科学技術大学、Huawei 他) 参加者は30~40人程度
  9. 人事多面評価のバイアス除去関連の動向 (2) Session: Data Science for Business Processes 自分が投稿した論文がもし採択されていたら、ここで発表していたかも? 発表は6件

    A/Bテスト前にKPIに及ぼす影響を、ログデータから数理最適化することでオフライン推定 (Spotify) 金融リスクガバナンスのための、企業のステークホルダーグラフから実質的支配者を推定 (武漢大学) 機械学習プロダクトの成熟度レベルの提案と、一部の指標測定の自動化 (Booking.com) バスケットボールチームの崩壊を、精神的な潜在状態の推定をもとに分析 (ボストン大学 他) クラウドサービスのインシデントで、LLMでトラブルシューティングワークフローを自動生成 (南開大学、Huawei Cloud 他) クラウドインフラのメモリエラーを、メモリアーキテクチャの階層構造を考慮しながら予測 (中国科学技術大学、Huawei 他) 参加者は30~40人程度 Dupret, Georges, et al. "ForTune: Running Offline Scenarios to Estimate Impact on Business Metrics." Proceedings of the 31st AC M SIGKDD Conference on Knowledge Discovery and Data Mining V. 1. 2 025. 人事 ではなく、
 OPE(オ フライン評価) のほうで む しろ興味深 い発表だった やっ ている ことはOPE とは異 なり、
 「 もし新 ロジ ックである値 がXpt改善 したら、
 ビジネ スメトリクスはYpt改善するだろう」 といっ たシミ ュレーショ ンを提供する ものである
  10. 人事多面評価のバイアス除去関連の動向 (2) Session: Data Science for Business Processes 自分が投稿した論文がもし採択されていたら、ここで発表していたかも? 発表は6件

    A/Bテスト前にKPIに及ぼす影響を、ログデータから数理最適化することでオフライン推定 (Spotify) 金融リスクガバナンスのための、企業のステークホルダーグラフから実質的支配者を推定 (武漢大学) 機械学習プロダクトの成熟度レベルの提案と、一部の指標測定の自動化 (Booking.com) バスケットボールチームの崩壊を、精神的な潜在状態の推定をもとに分析 (ボストン大学 他) クラウドサービスのインシデントで、LLMでトラブルシューティングワークフローを自動生成 (南開大学、Huawei Cloud 他) クラウドインフラのメモリエラーを、メモリアーキテクチャの階層構造を考慮しながら予測 (中国科学技術大学、Huawei 他) 参加者は30~40人程度 やは り、 直接プロダクトに 技術投 資をしていることが 多い 人 事データ 関連の 研究は、 今回のK DD本会議では 他セッシ ョンでも ほぼ 見当たらなか った
  11. OPE・因果推論関連の動向 (1) Workshop: 3rd Workshop on Causal Inference and Machine

    Learning in Practice KDDで3回 目に開催された、機械学習における因果推論の実践についてのワークショップ 論文発表は15件 (オーラル10件、ポスター5件) で、日本からの発表も多い 推薦システムのアイテムのようにアクションが増減する状況下のOff-Policy Learning (東京科学大学, ソニーグループ 他) Off-Policy Learning (OPL): OPEの評価結果を最適化するような方策(機械学習モデルetc.)を学習すること 推薦システムの入力層にユーザーの興味・同調を表現した埋め込みを注入することで
 Exposure Bias (人気商品や新作が優先表示されるバイアス) に対処 (LG Uplus) 複数の処置が同時になされるときの単独・相乗効果を推定するDLフレームワーク (NTT DOCOMO, 横浜市立大学) ポイント獲得等のために意識的に支出行動を操作する・しない顧客をベイジアンモデリング (NTT DOCOMO, 慶應義塾大学) Invited Talkも4件あり 処置のアウトカムが複数ある場合の因果効果推定の理論的な導出 (Linbo Wang氏; トロント大学) 比較的若い分野だが参加者は100人前後いて、盛り上がりを感じた Web Page: https://causal-machine-learning.github.io/kdd2025-workshop/
  12. OPE・因果推論関連の動向 (1) Workshop: 3rd Workshop on Causal Inference and Machine

    Learning in Practice KDD で3回目に開催された、機械学習における因果推論の実践についてのワークショップ 論文発表は15件 (オーラル10件、ポスター5件) で、日本からの発表も多い 推薦システムのアイテムのようにアクションが増減する状況下のOff-Policy Learning (東京科学大学, ソニーグループ 他) Off-Policy Learning (OPL): OPEの評価結果を最適化するような方策(機械学習モデルetc.)を学習すること 推薦システムの入力層にユーザーの興味・同調を表現した埋め込みを注入することで
 Exposure Bias (人気商品や新作が優先表示されるバイアス) に対処 (LG Uplus) 複数の処置が同時になされるときの単独・相乗効果を推定するDLフレームワーク (NTT DOCOMO, 横浜市立大学) ポイント獲得等のために意識的に支出行動を操作する・しない顧客をベイジアンモデリング (NTT DOCOMO, 慶應義塾大学) Invited Talkも4件あり 処置のアウトカムが複数ある場合の因果効果推定の理論的な導出 (Linbo Wang氏; トロント大学) 比較的若い分野だが参加者は100人前後いて、盛り上がりを感じた Offline Contextual Bandits in the Presence of New Actions;
 Yuta Saito* (Cornell University), Ren Kishimoto (Institute of Science Tokyo), Tatsuhiro Shimizu, Yusuke Narita (Yale University), Kazuki Kawamura,
 Takanori Muroi, Yuki Sasamoto, Kei Tateno, Takuma Udagawa (Sony Group Corporation); Web Page: https://causal-machine-learning.github.io/kdd2025-workshop/
  13. OPE・因果推論関連の動向 (1) Workshop: 3rd Workshop on Causal Inference and Machine

    Learning in Practice K DDで3回目に開催 された、機械学習に おける因果推論の実践に ついてのワ ークショップ 論文発表は15件 (オーラル10件、ポスター5件) で、日 本からの発表も多 い 推薦システムのアイテムのように アクションが増減す る状 況下 のOff-Polic y Lea rni ng (東京科学大学, ソニーグループ 他 ) Off-Polic y Lea rni ng (OPL): OPEの評 価結果を最適化す るような方策(機械学習モデルetc .)を学習す ること 推薦システムの入 力層に ユーザーの興味・同調を表現した埋め込みを注入す ることで
 Exp osure Bia s (人気商品や新作が優先 表示されるバ イアス) に 対処 (LG Up lus) 複数の処置が同時に なされるときの単独 ・相乗効果を推定す るDLフレームワ ーク (NTT DOCOMO, 横浜市立大学) ポイント獲 得等のために 意識的に 支出行動を操作す る・しない顧客をベイジアンモデリング (NTT DOCOMO, 慶應義塾大学) Invi ted Ta lkも4件あり 処置のアウ トカムが複数ある場合の因果効果推定の理論的な導出 (Li nbo Wa ng氏; トロ ント大学) 比較的若い分野 だが参加者は100人前後いて、盛り上がりを感じた W eb Pa ge: h ttp s://ca usa l-machi ne-lea rni ng. gi th ub.i o/ kdd2 02 5-w orksh op/ この分野 の勢 いを感じ た 適用先 のドメ インは様々だ が、似 たような技術課題 を共有 している アカデミ ック・ビ ジネ ス両者 がバ ランス良く共存 している
  14. OPE・因果推論関連の動向 (2) KDD全体における所感 特に興味深かった発表 Off-Policy Evaluation and Learning for the

    Future under Non-Stationarity (清水龍廣氏; イェール大学 他) ユーザの興味や行動が変わりゆく状況下 (非定常下) におけるOPE/OPL Session: Non-Stationary Environments & Optimization Counterfactual Fairness Through Transforming Data Orthogonal to Bias (カーネギーメロン大学) 機械学習モデルの公平性を、年齢・性別等の機微変数を変化させた反実仮想状況下のモデル予測結果で推定 Session: Algorithmic Fairness “Causal Inference and Discovery” “Causal Discovery and Domain Adaptation” というセッションがある タイトルに “Causal” “Causality” “Counterfactual” という単語を含む論文が様々なセッションに散らばっている Research Track 21件、Applied Data Science Track 2件、Datasets & Benchmarks Track 1件 Workshopとは異なり本会議ではアカデミック寄りなので、まだ事業会社での大きな課題解決には壁があるのかも? CausalBench という因果推論ベンチマークアプリケーションのTutorialもあり “Causality from Multi-Modal Data” (Caroline Uhler氏; Massachusetts Institute of Technology) という Keynote もあり
  15. OPE・因果推論関連の動向 (2) KDD全体における所感 特 に 興味深 かった発表 Off-P olicy Evaluation

    and Le ar ning f or the Future under Non- Stationar ity (清水龍廣氏; イェール大学 他) ユーザの興味や行 動が変わり ゆく状況下 (非定常下 ) におけるOP E/OP L Session: Non-Stationary Environments & Op timiz ation Counterf actual F ai rness Through Transf ormi ng Data Orthogonal to Bi as (カーネギーメロン大学) 機械学習モデルの公平性を、年齢・性別等の機微変数を変化させた反実仮想状況下のモデル予測結果で 推定 Session: Al gorithmic Fairness “Causal Inf erence and Di scovery” “Causal Di scovery and Domai n Adaptati on” というセッションがある タイトルに “Causal” “Causali ty” “Counterf actual” という単語を含む論文が様々なセッションに 散らばっている Research Track 21件、Appli ed Data Sci ence Track 2件、Datasets & Benchmarks Track 1件 Workshopとは異なり本会議で はア カデミ ック寄りなので 、まだ事業会社で の大きな課題解決に は壁があるのかも? CausalBench という因 果推論ベンチマークア プリ ケーションのTutori alもあり “Causali ty f rom Multi -Modal Data” (Caroli ne Uhler氏 ; Massachusetts Insti tute of Technology) という Keynote もあり Shi miz u, Tatsuhi ro, et al. " Off -P oli cy E valuati on and L earni ng f or the F uture under N on-Stati onari ty." P roceedi ngs of the 3 1st ACM SIG KDD Conf erence on Know ledge Di scovery and Data Mi ni ng V. 1. 20 25.
  16. OPE・因果推論関連の動向 (2) KDD全体における所感 特 に 興味深か った 発表 Off -

    Pol i c y E v aluat i on and Learn i ng for the F uture under Non - Stat i onar i t y ( 清水龍廣氏; イェール大学 他) ユーザの興味や行動が変わりゆく状況下 ( 非定常下) に おけるOPE/OPL S ess ion: Non-Stationary Environm e nt s & Optimization C ounterfactual F a i rness Through Transform i ng Data Orthogonal to B i as ( カーネギーメロン大学) 機械学習モ デ ルの 公平 性を、年齢・性別等の機 微 変数を変化 さ せ た 反実 仮 想状況下のモ デ ル予測結果で推定 S ess ion: Algorithmi c Fairn ess “Causal Inf e r e nc e and Discov e ry” “Causal Discov e ry and Domain Adaptation” というセッションがある タイトルに “Causal” “Causality” “Count e rfactual” という 単 語を含む論文が様々なセッションに散らばっている Research Track 21件、 A ppl i ed Data Sc i ence Track 2件、Datasets & Benchmarks Track 1件 Workshopとは 異 なり本会議ではアカ デ ミック寄りなので、まだ事業会社での大きな課題解決 に は壁があるのかも? C ausalBench という因果推論ベンチマークアプリケーションのTutor i alもあり “ C ausal i t y from Mult i- Modal Data” ( C arol i ne Uhler氏; Massachusetts Inst i tute of Technolog y ) という Ke y note もあり 機械学習・ デ ー タ マ イニ ン グ分野に おい て 因果推論の 考え方 が 浸透して い る 因果 効 果 自体 の 研究 だけではなく 、
 因果推論を 用 い た 課題解決を して いる 例 も 多 い
  17. まとめ 人事多面評価のバイアス除去関連 人事系のデータ利活用というドメインが非常に広いため、コミュニティを盛り上げる難しさを感じた 個社の人事を改善することで得られるメリットは限定的であるため、人事プロダクトでの技術導入が鍵になるかも? KDDでのワークショップは長年継続して開催されているため、今後のさらなる発展に期待したい 論文投稿については、現在は時機を伺っている状況ではあるが、チャンスがあればまた挑戦したい Off-Policy Evaluation (OPE)・因果推論関連 OPE・因果推論・反実仮想についても、当該セッションのみならず様々な発表で触れられており、


    これらの考え方がデータマイニング・機械学習分野に浸透してきていることを感じた LINEヤフーにおいても、この流れをよりキャッチアップし、実適用まで落とし込む取り組みの必要性を感じた 総じて… 自分の業務分野の最新動向や相対的な立ち位置について、多数の知見が得られた 事業会社のデータサイエンティストにとっては、アカデミックの最新研究を直接業務に活かせる機会は限られそうだが、
 新たな施策のヒントを得ることはできそうである