Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIのバカさ加減に怒る前にやっておくこと
Search
k2moons
October 29, 2025
Programming
0
210
AIのバカさ加減に怒る前にやっておくこと
存在しないAPIを捏造したり、実装を忘れたりする生成AIにモヤモヤする日々、指示を明確に出し、読むべき文書を体系化し、履歴を記録・共有することで、生成AIとの改善を目指す
k2moons
October 29, 2025
Tweet
Share
More Decks by k2moons
See All by k2moons
AI開発の精度を決める「4つの入力」
blueeventhorizon
0
79
Other Decks in Programming
See All in Programming
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
360
AI時代でも変わらない技術コミュニティの力~10年続く“ゆるい”つながりが生み出す価値
n_takehata
2
570
並行開発のためのコードレビュー
miyukiw
2
2.1k
JPUG勉強会 OSSデータベースの内部構造を理解しよう
oga5
2
220
CSC307 Lecture 10
javiergs
PRO
1
690
AIによる開発の民主化を支える コンテキスト管理のこれまでとこれから
mulyu
3
2.2k
日本だけで解禁されているアプリ起動の方法
ryunakayama
0
360
CSC307 Lecture 12
javiergs
PRO
0
450
AIとペアプロして処理時間を97%削減した話 #pyconshizu
kashewnuts
1
180
社内規程RAGの精度を73.3% → 100%に改善した話
oharu121
12
7.2k
2026年は Rust 置き換えが流行る! / 20260220-niigata-5min-tech
girigiribauer
0
210
Head of Engineeringが現場で回した生産性向上施策 2025→2026
gessy0129
0
200
Featured
See All Featured
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
220
Darren the Foodie - Storyboard
khoart
PRO
3
2.7k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
770
Color Theory Basics | Prateek | Gurzu
gurzu
0
220
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
260
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
63
Designing for humans not robots
tammielis
254
26k
A designer walks into a library…
pauljervisheath
210
24k
Building the Perfect Custom Keyboard
takai
2
700
So, you think you're a good person
axbom
PRO
2
1.9k
Transcript
AI のバカさ加減に怒る前に、 やっておくこと とらさん(k2moons ) AI を“ 相棒” にするための勉強会 2025/10/29
自己紹介 名前:とらさん(k2moons ) 所属: 株式会社ゆめみ 仕事:iOS エンジニア X : k2_moons
Github : BlueEventHorizon 好きな生成AI : Claude Code
バカさ加減に怒った事例
存在しないAPI を捏造して認めない Gemini 「XXXX(...) というメソッドがあります」と回答 公式ドキュメントに存在しない 「 無いからちゃんと読め 」 →「
公式ドキュメントにあります 」 → 「 無いからちゃんと読め 」の 無限ループ に陥る
やったこと Ctl+C
呼び出す関数を、推測で決め打ちして実装 Claude Code 「fetchAllResults(sortedBy: .date) 」という架空の便利関数を呼び 出す 実際は getAll() と
sort() を組み合わせる必要があった
やったこと ビルドエラーを指摘して、 「ちゃんとコードを読んだのか」と説教 「コードを読んでいませんでした」と謝罪したのでモヤモヤしなが ら許す
やったことを忘れる問題 実装済みのクラスや関数を忘れて、もう一回同じやつを実装 設計書に書いてあるルールを守らない 余計な機能や実装を入れてくる
やったこと レビューで指示を出しまくる 疲れる
Gemini は論外 今は進化してちゃんとしてます!(たぶん) なるべく楽したいと思っている 言われないと文書を読まない もの忘れが激しい
どうする?
毎回やるべきことを提示し直す? 文書をきっちり指定する? やったことを記録する?
毎回やるべきことを提示し直す? 文書をきっちり指定する? まず文書体系を考える やったことを記録する?
> Project ├─ docs/ … プロジェクト横断の開発基盤 │ ├─ rules/ …
開発ルール │ │ ├─ project_rule.md … AIの役割 │ │ ├─ common/ … アーキテクチャ │ │ ├─ layers/ … レイヤー毎の実装ルールなど │ ├─ workflow/ … 作業手順 │ │ ├─ plan/ … 要件抽出→設計→計画作成 │ │ ├─ dev/ … タスク制御とAgent実装手順 │ │ └─ refactoring/ … リファクタリング │ └─ format/ … 要件/設計/計画/ヘッダーのテンプレート │ └─ project_docs/ … プロジェクト固有の知識・計画 ├─ spec/ … 要件定義カタログ │ ├─ architecture/ … アーキテクチャ │ ├─ business_logic/ … ビジネスロジック仕様 │ ├─ functions/ … 機能横断要件 │ ├─ screens/ … 画面仕様 │ ├─ ui_components/ … 再利用UI要件 │ └─ non_functional/ … 非機能要件 ├─ design/ … 設計書 ├─ plan/ │ └─ main_plan.md … 計画書 └─ history/ … 会話記録
None
特徴 iOS 開発汎用の文書と、アプリ固有の文書に分かれている ルールとワークフロー 要件定義、設計書、計画書をリンク 課題 非常に数が多い
毎回やるべきことを提示し直す? 指示を出す 文書をきっちり指定する? やったことを記録する?
Claud Code の場合 Sub Agents を使うと便利です。
便利だけど大変です。 親の Claude Code から Context を渡せるので 親の Calude Code
向けのワークフローを用意する 受け取った Sub Agent のワークフローを用意する Sub Agent 毎に必読文書リストを定義
書き方 絶対に読んでもらわないといけない文書は、 [CRITICAL] 下記の文書を全て読み込み、深く理解すること - `docs/workflow/dev/task_execution_workflow.md`
課題 文書が増えてくるとメンテナンスできない
毎回やるべきことを提示し直す? 文書をきっちり指定する? やったことを記録する? 記録する
検討してきた内容、対話した内容を記録する # 検討してきた内容、対話した内容を簡潔に履歴にまとめる ## CONVERSATION_HISTORY 今まで検討してきた内容、対話した内容を簡潔に履歴にまとめてください。 ファイルは、`project/history/CONVERSATION_HISTORY.md` です。 存在する場合は、追記して下さい。 存在しない場合は作成して記入
してください。 ## LATEST_CONVERSATION_HISTORY `project/history/CONVERSATION_HISTORY.md` の中から、新しい生成AIに必ず知って貰いたい開発の経緯を、 `project/history/LATEST_CONVERSATION_HISTORY.md` として 2000文字以内でピックアップして記録してください。 存在する場合は、削除して構いません。編集してもOKです。
今まで検討してきた内容、対話した重要内容を読み込 む # 今まで検討してきた内容、対話した重要内容を読み込む `project/history/LATEST_CONVERSATION_HISTORY.md` を読んで、深く理解してください。 不明点は、`project/history/CONVERSATION_HISTORY.md` を読むと分かるかもしれません。
文書をきっちり指定する? PageIndex https://github.com/VectifyAI/PageIndex に触発される
RAG (Retrieval-Augmented Generation ) は、文書検索で「意味的 な類似性」に依存。しかし、類似性は必ずしも関連性を意味しない。 専門的で長文の文書を扱う場合、単なる類似検索では、重要な情報を 取り出すことが難しい。 推論型RAG システムを提案。PageIndex
は、人間の専門家が長文ドキ ュメントを読む際の「探索と推論」の過程を模倣し、ツリー探索を通 じて最も関連性の高い部分を特定する。 1. ドキュメント全体から「目次(Table of Contents ) 」に相当するツ リー構造のインデックスを生成する。 2. そのツリー構造上で 推論に基づく探索(ツリーサーチ)を行い 、 最も関連性の高い箇所を取得する。
# 開発文書検索インデックス --- name: 開発文書検索インデックス description: AI活用iOS開発における、要件定義から実装までの全工程で参照すべき ルール・ワークフロー・フォーマット文書を体系的に整理した検索インデックス。 Clean Architecture、Actor並行性、Protocol-based
DIに基づく開発指針を提供。 --- ## このTOCの使い方 1. **Quick Reference**: 最重要文書を特定(常に参照すべき文書、実装時に参照する文書) 2. **カテゴリ別概要**: 開発工程ごとの文書分類(rules/workflow/format) 3. **キーワードインデックス**: 具体的な実装内容を検索(Service実装、Entity定義、データフロー等) 4. **ディレクトリ別詳細目次**: 全文書の要約と主要トピック 5. **文書間の関係性マップ**: 要件定義→設計→計画→実装の流れ 6. **タグ別インデックス**: 実装層別検索(#Domain, #UI, #Infrastructure, #Architecture等)
Claud Code の場合 Skills を使うと便利です。
コードは、どう読ませる?問題
Serene https://github.com/oraios/serena
Swift-Selena 自作しました https://github.com/BlueEventHorizon/Swift-Selena
まとめ 何を読ませる どう読ませる まだまだ試行錯誤してます