Upgrade to Pro — share decks privately, control downloads, hide ads and more …

関西kaggler会_2025_1_Mujirushi.pdf

mujirushi
March 07, 2025
550

 関西kaggler会_2025_1_Mujirushi.pdf

mujirushi

March 07, 2025
Tweet

Transcript

  1. ・名前:鈴木 明作(スズキ メイサク) ・所属:NTT docomo R&D ・学会コンペ参加歴: - KDDCUP 2023(Amazon

    Task3) : 9位入賞 - Human Mobility Challenge 2023 : 3位入賞 - KDDCUP 2024(清華大学 Task1,Task2) : 6位入賞, 6位入賞 - Human Mobility Challenge 2024(geo-bleu部門) : 3位入賞 自己紹介
  2. 学会コンペ vs Kaggle 学会コンペ(KDDCUPの場合) Kaggle 課題設定 学術的・研究的な課題が多い 実務(ビジネス)寄りな課題が多い コンペ開催時期 学会開催前

    常時開設 最終順位 Public LeaderBoardで決定 Private LeaderBoardで決定 予測提出形式 コンペに完全依存(github, csv, etc.) お決まりパターンがある(csv, コード, etc.) 入賞順位 上位5~10位 参加チーム数に応じた 上位数%にメダル付与 参加チーム数 数十〜数百チーム 数百〜数千チーム 解法公開 論文 & 学会発表 winners call & Kaggleのdiscussion, code ※ 一般化しているため、あくまで参考です
  3. ・KDDCUP2024では、①Amazon, ②Meta, ③清華大/ZhipuAIの3社がコンペ主催 ・その結果、合計で11個のコンペが開催(Task1つ=1コンペ) ① Amazon主催 オンラインショップLLM応答 ② Meta主催 RAG応答精度の向上

    ③ 清華大学/ZhipuAI主催 論文データベース関連予測 TASK1. ショッピングコンセプト理解 TASK2. ショッピング知識推論 TASK3. ユーザ行動の調整 TASK4. 多言語での応答 TASK5. TASK1~4の総合評価 TASK1: 著者と紐付く論文を予測 TASK2: 学術質問に紐づく論文を予測 TASK3: 引用論文の影響度を予測 TASK1:検索要約 TASK2:ナレッジ予約とweb検索 TASK3: E2Eの検索拡張生成 KDDCUP2024の例
  4. 学会コンペは”研究”の役に立つ(Kaggle advent calendar 2024 Yyamaさん記事の一部抜粋) “Kaggleは研究の役に立ってる: ソリューションとコンペデータのその後 (医用画像を中心に)” ・コンペのソリューションが研究に用いられた事例 “この研究では、読影レポートから臓器別の異常所見の有無について構造化ラベルを構築した上で、

    教師あり学習を行うことによりCTの異常所見を検出することに成功しています。 …RSNAのCervical Spine Fracture Detectionで用いられた手法にヒントを得たことが明言 されています。” https://note.com/yyama0/n/n290a5a28708c KaggleのRSNA(放射線科学会) が研究に役立ってる事例を紹介
  5. 学会コンペはKaggleは学会コンペの役に立つ! 過去のKaggle上位解法を活用して学会コンペ6位入賞 例)3rd place solution Kaggle: Learning Equality ・概要:幼稚園~高校3年生の教材同士マッチング ・上位解法:検索&リランキング,対照学習

    etc. 学会コンペ: KDDCUP2024 ③清華大学Task2 ・概要:学術質問と対応する論文をマッチング ・上位解法:検索&リランキング,対照学習 etc. リランキング 論文 40万件 予測 検索 100件 20件
  6. 参考. NTT docomo KDDCUP2024参加記事 ・KDDCUP2024に入賞したので現地でポスター発表してきました https://nttdocomo-developers.jp/entry/2024/10/16/090000 ・データ分析コンペ KDDCUP 2024 OAG-IND

    入賞解法の紹介 https://nttdocomo-developers.jp/entry/2024/11/14/090000 ・データ分析コンペKDDCUP 2024 OAG-AQA 6位入賞解法の紹介 https://nttdocomo-developers.jp/entry/2024/10/17/090000 ・「引用論文の影響度合いを予測せよ」:データ分析コンペKDDCUP2024 OAG-PST 8位入賞解法紹介 https://nttdocomo-developers.jp/entry/2024/11/06/090000 https://qiita.com/dcm_chida/items/5da1530ab69961c2c828