$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIのバカさ加減に怒る前にやっておくこと
Search
k2moons
October 29, 2025
Programming
0
190
AIのバカさ加減に怒る前にやっておくこと
存在しないAPIを捏造したり、実装を忘れたりする生成AIにモヤモヤする日々、指示を明確に出し、読むべき文書を体系化し、履歴を記録・共有することで、生成AIとの改善を目指す
k2moons
October 29, 2025
Tweet
Share
Other Decks in Programming
See All in Programming
AIエージェントを活かすPM術 AI駆動開発の現場から
gyuta
0
360
宅宅自以為的浪漫:跟 AI 一起為自己辦的研討會寫一個售票系統
eddie
0
490
UIデザインに役立つ 2025年の最新CSS / The Latest CSS for UI Design 2025
clockmaker
18
7.2k
これだけで丸わかり!LangChain v1.0 アップデートまとめ
os1ma
6
1.7k
FluorTracer / RayTracingCamp11
kugimasa
0
220
開発に寄りそう自動テストの実現
goyoki
1
760
Developing static sites with Ruby
okuramasafumi
0
250
LLMで複雑な検索条件アセットから脱却する!! 生成的検索インタフェースの設計論
po3rin
2
650
バックエンドエンジニアによる Amebaブログ K8s 基盤への CronJobの導入・運用経験
sunabig
0
140
TypeScriptで設計する 堅牢さとUXを両立した非同期ワークフローの実現
moeka__c
6
3k
SwiftUIで本格音ゲー実装してみた
hypebeans
0
110
全員アーキテクトで挑む、 巨大で高密度なドメインの紐解き方
agatan
8
20k
Featured
See All Featured
A better future with KSS
kneath
240
18k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
970
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
720
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.8k
Six Lessons from altMBA
skipperchong
29
4.1k
Raft: Consensus for Rubyists
vanstee
141
7.2k
The World Runs on Bad Software
bkeepers
PRO
72
12k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
The Cult of Friendly URLs
andyhume
79
6.7k
What's in a price? How to price your products and services
michaelherold
246
12k
How to train your dragon (web standard)
notwaldorf
97
6.4k
Transcript
AI のバカさ加減に怒る前に、 やっておくこと とらさん(k2moons ) AI を“ 相棒” にするための勉強会 2025/10/29
自己紹介 名前:とらさん(k2moons ) 所属: 株式会社ゆめみ 仕事:iOS エンジニア X : k2_moons
Github : BlueEventHorizon 好きな生成AI : Claude Code
バカさ加減に怒った事例
存在しないAPI を捏造して認めない Gemini 「XXXX(...) というメソッドがあります」と回答 公式ドキュメントに存在しない 「 無いからちゃんと読め 」 →「
公式ドキュメントにあります 」 → 「 無いからちゃんと読め 」の 無限ループ に陥る
やったこと Ctl+C
呼び出す関数を、推測で決め打ちして実装 Claude Code 「fetchAllResults(sortedBy: .date) 」という架空の便利関数を呼び 出す 実際は getAll() と
sort() を組み合わせる必要があった
やったこと ビルドエラーを指摘して、 「ちゃんとコードを読んだのか」と説教 「コードを読んでいませんでした」と謝罪したのでモヤモヤしなが ら許す
やったことを忘れる問題 実装済みのクラスや関数を忘れて、もう一回同じやつを実装 設計書に書いてあるルールを守らない 余計な機能や実装を入れてくる
やったこと レビューで指示を出しまくる 疲れる
Gemini は論外 今は進化してちゃんとしてます!(たぶん) なるべく楽したいと思っている 言われないと文書を読まない もの忘れが激しい
どうする?
毎回やるべきことを提示し直す? 文書をきっちり指定する? やったことを記録する?
毎回やるべきことを提示し直す? 文書をきっちり指定する? まず文書体系を考える やったことを記録する?
> Project ├─ docs/ … プロジェクト横断の開発基盤 │ ├─ rules/ …
開発ルール │ │ ├─ project_rule.md … AIの役割 │ │ ├─ common/ … アーキテクチャ │ │ ├─ layers/ … レイヤー毎の実装ルールなど │ ├─ workflow/ … 作業手順 │ │ ├─ plan/ … 要件抽出→設計→計画作成 │ │ ├─ dev/ … タスク制御とAgent実装手順 │ │ └─ refactoring/ … リファクタリング │ └─ format/ … 要件/設計/計画/ヘッダーのテンプレート │ └─ project_docs/ … プロジェクト固有の知識・計画 ├─ spec/ … 要件定義カタログ │ ├─ architecture/ … アーキテクチャ │ ├─ business_logic/ … ビジネスロジック仕様 │ ├─ functions/ … 機能横断要件 │ ├─ screens/ … 画面仕様 │ ├─ ui_components/ … 再利用UI要件 │ └─ non_functional/ … 非機能要件 ├─ design/ … 設計書 ├─ plan/ │ └─ main_plan.md … 計画書 └─ history/ … 会話記録
None
特徴 iOS 開発汎用の文書と、アプリ固有の文書に分かれている ルールとワークフロー 要件定義、設計書、計画書をリンク 課題 非常に数が多い
毎回やるべきことを提示し直す? 指示を出す 文書をきっちり指定する? やったことを記録する?
Claud Code の場合 Sub Agents を使うと便利です。
便利だけど大変です。 親の Claude Code から Context を渡せるので 親の Calude Code
向けのワークフローを用意する 受け取った Sub Agent のワークフローを用意する Sub Agent 毎に必読文書リストを定義
書き方 絶対に読んでもらわないといけない文書は、 [CRITICAL] 下記の文書を全て読み込み、深く理解すること - `docs/workflow/dev/task_execution_workflow.md`
課題 文書が増えてくるとメンテナンスできない
毎回やるべきことを提示し直す? 文書をきっちり指定する? やったことを記録する? 記録する
検討してきた内容、対話した内容を記録する # 検討してきた内容、対話した内容を簡潔に履歴にまとめる ## CONVERSATION_HISTORY 今まで検討してきた内容、対話した内容を簡潔に履歴にまとめてください。 ファイルは、`project/history/CONVERSATION_HISTORY.md` です。 存在する場合は、追記して下さい。 存在しない場合は作成して記入
してください。 ## LATEST_CONVERSATION_HISTORY `project/history/CONVERSATION_HISTORY.md` の中から、新しい生成AIに必ず知って貰いたい開発の経緯を、 `project/history/LATEST_CONVERSATION_HISTORY.md` として 2000文字以内でピックアップして記録してください。 存在する場合は、削除して構いません。編集してもOKです。
今まで検討してきた内容、対話した重要内容を読み込 む # 今まで検討してきた内容、対話した重要内容を読み込む `project/history/LATEST_CONVERSATION_HISTORY.md` を読んで、深く理解してください。 不明点は、`project/history/CONVERSATION_HISTORY.md` を読むと分かるかもしれません。
文書をきっちり指定する? PageIndex https://github.com/VectifyAI/PageIndex に触発される
RAG (Retrieval-Augmented Generation ) は、文書検索で「意味的 な類似性」に依存。しかし、類似性は必ずしも関連性を意味しない。 専門的で長文の文書を扱う場合、単なる類似検索では、重要な情報を 取り出すことが難しい。 推論型RAG システムを提案。PageIndex
は、人間の専門家が長文ドキ ュメントを読む際の「探索と推論」の過程を模倣し、ツリー探索を通 じて最も関連性の高い部分を特定する。 1. ドキュメント全体から「目次(Table of Contents ) 」に相当するツ リー構造のインデックスを生成する。 2. そのツリー構造上で 推論に基づく探索(ツリーサーチ)を行い 、 最も関連性の高い箇所を取得する。
# 開発文書検索インデックス --- name: 開発文書検索インデックス description: AI活用iOS開発における、要件定義から実装までの全工程で参照すべき ルール・ワークフロー・フォーマット文書を体系的に整理した検索インデックス。 Clean Architecture、Actor並行性、Protocol-based
DIに基づく開発指針を提供。 --- ## このTOCの使い方 1. **Quick Reference**: 最重要文書を特定(常に参照すべき文書、実装時に参照する文書) 2. **カテゴリ別概要**: 開発工程ごとの文書分類(rules/workflow/format) 3. **キーワードインデックス**: 具体的な実装内容を検索(Service実装、Entity定義、データフロー等) 4. **ディレクトリ別詳細目次**: 全文書の要約と主要トピック 5. **文書間の関係性マップ**: 要件定義→設計→計画→実装の流れ 6. **タグ別インデックス**: 実装層別検索(#Domain, #UI, #Infrastructure, #Architecture等)
Claud Code の場合 Skills を使うと便利です。
コードは、どう読ませる?問題
Serene https://github.com/oraios/serena
Swift-Selena 自作しました https://github.com/BlueEventHorizon/Swift-Selena
まとめ 何を読ませる どう読ませる まだまだ試行錯誤してます