Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Kaggle過去コンペ上位解法をAIエージェントでレポートする

Avatar for Kyohei Uto Kyohei Uto
September 18, 2025
38

 Kaggle過去コンペ上位解法をAIエージェントでレポートする

Avatar for Kyohei Uto

Kyohei Uto

September 18, 2025
Tweet

Transcript

  1. AI 6 コンペ概要(overview)とdiscussion情報はcsvのカラムにmarkdownテキストで挿入されて いる。そのままではデータサイズが多くノイズも含まれるため以下のような前処理をして markdownファイルを生成する データの前処理 overview/discussion情報 (markdownファイル) meta kaggle

    Competitions.csv Forums.csv ForumMessages.csv ForumTopics.csv コンペティション フィルタ ソリューション フィルタ 指定したコンペ名でデータ をフィルタする 指定したキーワードで解法 discussionをフィルタする ex; place, solution, 1st, 2nd, 3rd, 4th, 5th…
  2. AI 目的: 指定したコンペティションの上位解法を網羅し詳細で比較可能なレポートを作成する。 要件: • 出力形式: Markdown • 情報源: 指定フォルダ内に存在する上位解法投稿(例

    : 1位, 2位, 3位…)を漏れなく含める。存在しない順位は書かない • 記述内容 ◦ 概要、問題設定、評価指標 ◦ 各解法の詳細 ▪ データ/特徴量/前処理/後処理 ▪ モデル構成・学習戦略・検証方法、 ▪ 推論・実装上の工夫(高速化、最適化、リソース削減など) ▪ 独自の工夫・課題解決策 ▪ 参照元URL: 必ず Kaggle Discussion の投稿URLを明記 ◦ 横断比較 ▪ 共通要素を引用付きで整理 ▪ 解法同士の違い・関連性を分析的にまとめる • 画像: 投稿本文に画像 URLがあれば、対応する説明箇所に ![](URL) を挿入して表示 • 表現: ただの日本語訳ではなく、解法間の関係や差分がわかるよう分析・要約する • 禁止事項: 記憶や外部情報による補完・推測は禁止。必ずフォルダ内資料だけを根拠にする 9 プロンプトの例 基本的に以下を利用しリサーチ方法に応じてパス名などを補完する
  3. AI 17 ▪良い点 - レポートの質が高く個別解法だけでなく 共通点/相違点のまとめ方が上手い - 情報が多い - 具体的な数字がレポートに含まれている

    - 引用も適切に載せてくれている ▪もう少しな点 - 画像は表示されない - 引用がgoogle driveのファイルになる Deep Researchによるリサーチ結果 https://chatgpt.com/s/dr_68c4b52a16f48191b8caa5499c5e7d47
  4. AI 21 LangChainで実装されたOSSのDeep Researchプロジェクト 今回はこれをベースにリサーチエージェントを作成する。 1. Scope: ユーザの指示を明確にする 2. Research:

    Supervisorがsub agentにリサーチタスクの指示を出し調査 3. Write: 集めた情報を集約しレポートを作成 Open Deep Researchとは
  5. AI 26 - レポート性能ならChatGPT Deep Researchを使うのが一番良いと感じた - 実用上は手動でデータをアップロードしたりが面倒なのでOpen AIのDeep Research

    APIを利用してwebアプリケーションにするとより手軽に使えて良さそう - LangChainエージェントはまだまだ改善の余地あり まとめ