Upgrade to Pro — share decks privately, control downloads, hide ads and more …

プロンプトエンジニアリングの手法、Kaggleでの使われ方 まとめ

sin chir0
April 12, 2025
680

プロンプトエンジニアリングの手法、Kaggleでの使われ方 まとめ

sin chir0

April 12, 2025
Tweet

Transcript

  1. 自己紹介 sinchir0 / 齋藤 慎一朗 - 請求書、契約書、ニュースをNLPでなんとかする仕事 - Kaggle Competitions

    Expert🥈4🥉4 - Kaggle Notebooks Expert 🥇2🥈6🥉7 - Kagger Running Club 所属 - 著者: Polarsとpandasで学ぶ データ処理アイデアレシピ55
  2. - プロンプトエンジニアリング手法 - 基本的なプロンプト - Zero Shot CoT[Kojima 2022] -

    Few-Shot CoT[Wei 2022] - Self-Consistency[Wang 2023] - Tree of Thoughts[Yao 2023] - Graph of Thoughts[Besta 2023] - Step-back prompting[Zheng 2024] - Self Discover[Zhou 2024] - Kaggleでどう使われるか? - 概要 - EEDI 1stでの使われ方 - AIMO1 1stでの使われ方 - AIMO2 8thでの使われ方 アジェンダ
  3. NeurIPSとICLRが多め 参考文献 名前 学会 URL [Wei2022] Few-Shot CoT NeurIPS 2022

    Link [Kojima2022] Zero Shot CoT NeurIPS 2022 Link [Wang2023] Self-Consistency ICLR 2023 Link [Yao2023] Tree of Thoughts NeurIPS 2023 Link [Besta2023] Graph of Thoughts AAAI 2024 Link [Zheng2024] Step-back prompting ICLR 2024 Link [Zhou2024] Self Discover NeurIPS 2024 Link
  4. - Zero Shot prompting - 質問や指示の仕方などなんでも OK - One Shot

    prompting, Few Shot prompting - 例をプロンプトに対して与える - Role prompting - モデルに特定の役割を与える - Contextual prompting - 背景情報を与える 基本的なプロンプト
  5. - Few Shot CoTに対し、Let’s think step by stepとプロンプトに付け足すだけで十分 に性能向上することを示した。 -

    一方、具体例を用意する手間はあるが、Few-Shot CoTの方が性能は高い。 Zero Shot CoT[Kojima 2022]
  6. - Stage1とStage2に分かれる。 - Stage1は、さらに3ステップに分かれる。 - SELECT: 39の推論モジュールのリストから問題解決に役立つ推論モジュールを選択 - ADAPT: 選択されたモジュールをタスクに適する形で言い換えて具体化

    - IMPLEMENT: 適応されたモジュールを JSON形式の構造化されたデータとしてまとめる - Stage2は、Stage1の推論構造を利用しJSONの値を埋める。 Self Discover[Zhou 2024]
  7. - LLM による思考プロセスも含めたデータセットを作成するために、 Claude 3.5 Sonnetに対してCoTを利用した。 (EEDI 1st) - 誤解がどのような思考の過程で起きるかの情報量を増やすために、CoT

    を利用し た。(EEDI 2nd) - プロンプトに対し、 Self-Consistency を拡張した ToT に近い方法を考案し、性 能を改善した。 (AIMO1 1st) - Self-Consistency が利用された Solution をベースにした。(AIMO1 3rd, 4th) - ChatGPT3.5 を用いて、QA dataset を作成する際のプロンプトに、Role prompting、Contextual prompting、Few Shot prompting が利用されている。 (LLM Science Exam 5th) - 時間制限を加味した ToT(AIMO2 8th) 概要 ソリューション全体の ほんの一部分だよ!
  8. - Claude 3.5 Sonnetを用いてデータセットを生成する際に、CoTを行った。 - (i) 問題の説明、(ii) 正解、(iii) 不正解、(iv) 誤解、(v)

    深く関連するいくつかの誤解 を提供し、学生が不正解を選択するに至った可能性のある思考プロセスを生成す るように促した。 EEDI 1stでの使われ方 https://www.kaggle.com/competitions/eedi-mining-misconceptions-in-mathematics/discussion/551688 プロンプトの一部
  9. - 数学の問題をLLMに解かせるコンペ - AIMO1 - Apr 2, 2024 ~ Jun

    28, 2024 - GPU Notebook <= 9 hours run-time - AIMO2 - October 18, 2024 ~ Apr 2, 2025 - GPU Notebook <= 5 hours run-time AIMOコンペの概要 https://www.kaggle.com/competitions/ai-mathematical-olympiad-prize https://www.kaggle.com/competitions/ai-mathematical-olympiad-progress-prize-2