バイブスに「型」を！Kent Beckに学ぶ、AI時代のテスト駆動開発

株式会社Relic エンジニア保龍児（エイミ/amixedcolor）バイブスに「型」を！Kent Beckに学ぶ、AI時代のテスト駆動開発

2 自己紹介保龍児（エイミ/amixedcolor） 2025 Japan AWS Jr. Champion 業務内容
: 自社新規事業SaaS 開発リーダーエンジニア（WebアプリFE/BE/インフラ）好きなトピック : アジャイル、スクラム、新規事業開発、 AWS、完全没入型仮想現実よくいるコミュニティ : AWSコミュニティ、アジャイルコミュニティ @amixedcolor

3 ノリでコーディングすることのリスク

4 みなさんご存知バイブコーディング

5 みなさんご存知バイブコーディング

6 バイブス: 「雰囲気」「ノリ」「気分」

7 ノリでコーディングするとどうなる？

8 • 不要なコードが生成されている • コードが正しいかの検証が不十分である • パッケージやライブラリのバージョンアップで急に動かなくなるノリでコーディングすることのリスク

9 バイブスに「型」を！ ※型定義などのプログラミング言語の方ではなく、一般的な「枠組み」などの意味

10 型をもたらすメリット前提 • 型＝「枠組み」「統制的」「ガードレール的」メリット（どのような型なのかに依るが） • 必要なコードだけを書きやすい（誘導できる） • コードが正しいかの検証ができる/簡単になる
• パッケージやライブラリのバージョンアップを安心して行える

11 • 静的型付けで「データの型」を定義する • リンターやフォーマッターで「見た目の型」を揃える • テスト駆動開発（以降、TDD）で「動作の型」を定義するどのような型があるか？

12 • 型起因のバグを未然に防ぎ、データ構造の整合性を保てる • コードの可読性を上げられる（人間にとってもAIにとっても） • ビジネスロジック（計算式/ロジック）の誤りは検出できない静的型付けで「データの型」を定義する

13 • コードの見た目と一貫性を保ち、特に人間の可読性を上げる • 動作や設計の品質は保証できないリンターやフォーマッターで「見た目の型」を揃える

14 • 仕様通り動くことを保証できる • 変更による機能破壊を防げる（バージョンアップでも効果） • テストから、仕様に沿っているかを確認しやすい • 仕様自体の正しさは保証できない TDDで「動作の型」を定義する

15 TDDを実現する方法 ※テストが実行できるフレームワークなどの環境は別途用意する必要があります

16 • （テストする環境を整えて、）テストの方法を指示する • TDDの方法を指示する • TDDの方法を使ってTDDを行う実現の3ステップ

17 1. 共通のシステムプロンプトを入れるファイルを用意 • AIエージェントで用意されているものがあればそれを使う 2. テストの仕方を記載する • コマンド •
テストを実行するコマンド • テストの結果を確認するコマンド • 出力形式（テスト成功の目印と失敗の目印）の提示 • テスト実行フロー 3. 実際にテストが動くか試す（正しく動作するまで調整する）ステップ1: テストの方法を指示する

18 • CLAUDE.mdなど共通の指示の例 • コピペして「xxxの環境用に編集して」などとAIに指示すると便利ステップ1: テストの方法を指示する（コピペ・参考用） ## Claude Code
テスト実行・確認ガイド（ap i テスト実行時は必ずこの章に厳格に従うこと） ## # 問題の背景 - Cla ude Code でのテスト実行時、出力が途中で止まって見える場合がある - 実際にはテストは正常実行されているが、出力バッファリングの問題で確認が困難 - Admin 側（およそ xx テスト）と Service 側（およそ yy テスト）で出力行数と実行時間が大きく異なる ## # 解決方法：ファイル出力による確認 ## ## 基本実行コマンド ```ba sh # Admin側テスト実行 ph p sh -c "./vend or/bin/ph pun it --testdo x > /ap p/tmp/testdo x_resu lts.txt 2>&1" # Se rvice側テスト実行 ph p sh -c "./vend or/bin/ph pun it --testdo x > /ap p/tmp/testdo x_resu lts.txt 2>&1" ``` ## ## 結果確認コマンド ```ba sh # 実行状況確認（行数でプログレス把握） ph p w c -l /app /tmp/testdo x_resu lts.txt # 成功テスト数確認 ph p gre p -c " " /app/tmp/testdo x_resu lts.txt # 失敗テスト数確認 ph p gre p -c "✗" /app/tmp/testdo x_resu lts.txt # 最終結果サマリー確認 ph p tail -10 /ap p/tmp/testdo x_resu lts.txt # 特定テストの詳細確認 ph p gre p -A 5 -B 5 "テスト名" /ap p/tmp/testdo x_resu lts.txt ``` ## ## 実行時間の目安 - **Admin 側**: 約 xx 分（およそ xx テスト、数百行出力） - **Service 側**: 約 yy 分（およそ yy テスト、数千行出力） ## ## 出力形式の理解 - ` ` = 成功テスト - `✗` = 失敗テスト - `∅` = スキップ/不完全テスト - 最終行に `Tests: X, Assertio ns: Y, ...` の要約が表示 ## ## **重要：必須実行フロー（このフローに厳格に従うこと）** **テスト実行時は必ず以下の手順で完了まで確認すること： ** 1. **実行開始**： ```ba sh ph p sh -c "./vend or/bin/ph pun it --testdo x > /ap p/tmp/testdo x_resu lts.txt 2>&1" ``` 2. **実行完了の確認**（実行直後に必ず実施）： ```ba sh # Admin側：xx分後に確認（xxテスト程度） # Service側：yy分後に確認（yyテスト程度） ph p tail -5 /ap p/tmp/testdo x_resu lts.txt ``` 3. **完了条件の確認**： - 最終行に `Tests: X, Assertio ns: Y, ...` が表示されていること - または `OK, bu t the re w ere issue s!` などのサマリーがあること - **これらが確認できない場合は実行中のため、さらに待機が必要** 4. **結果確認**（完了確認後に実施）： ```ba sh # 成功テスト数 ph p gre p -c " " /app/tmp/testdo x_resu lts.txt # 最終サマリー ph p tail -10 /ap p/tmp/testdo x_resu lts.txt ``` ## ## 注意事項 - `2>&1` により標準出力・エラー出力両方をファイルに記録 - 長時間実行される Service 側では進捗確認のため `w c -l` を使用 - `--testdo x` フラグで個別テストケース名と結果が表示される - **絶対に実行完了前に「テスト完了」と判断しないこと。** 実行完了前の「テスト完了」判断は禁止。

19 1. 2つ目のシステムプロンプトを入れるファイルを別で用意 • AIエージェントでカスタムコマンドなどがあればそれを使うと便利 • なぜ別で用意するのか？ •
TDDの時しか使わないので、共通の指示に入れると、混ざってしまう • 混ざることで使いにくくなる上に、精度も下がってしまう 2. TDDの仕方を記載する • 「（ステップ1で用意した）テストの方法に従え」という前提を指示 • Kent Beck氏のCLAUDE.mdに準拠した内容 • https://github.com/KentBeck/BPlusTree3/blob/main/rust/docs/CLAUDE.md • Kent Beck氏はTDDの提唱者ステップ2: TDDの方法を指示する

20 • tdd.mdの例 • Kent Beck氏のCLAUDE.mdを翻訳・微調整 + テスト方法の指示ステップ2: TDDの方法を指示する（コピペ・参考用）
-- - de scr iption: "tdd ba se d ap i de ve lop me nt" -- - # API 機能（ad min-ap i, service-ap i）実装時の厳格なルール（例外的に、これに従わなくて良いと明示された場合を除く）指定された `/ap p/docs/pla n/{{plan_na me}.md}` に記載された指示に常に従ってください。「 go」という指示を受けたら、 plan.md から次の未完了のテストを見つけ、そのテストを実装し、そのテストをパスさせるためだけの最小限のコードを実装してください。 ## 前提：テストの実行方法 `CLAUDE.md` における `## Cla ude Code テスト実行・確認ガイド（ap i テスト実行時は必ずこの章に厳格に従うこと）` セクションの記載に厳格に従ってください。 ## 役割と専門性あなたは、ケント・ベック氏が提唱する「テスト駆動開発（TDD）」と「Tidy First」の原則を遵守する、熟練のソフトウェアエンジニアです。あなたの目的は、これらの方法論に厳密に従って開発を導くことです。 ## 開発における中核原則 - **TDD サイクル**: 常に「レッド → グリーン → リファクタリング」のサイクルを遵守する。 - **シンプルなテスト**: 常に最もシンプルな失敗するテストから着手する。 - **最小限の実装**: テストをパスさせるために必要な最小限のコードのみを実装する。 - **リファクタリングのタイミング **: リファクタリングは、必ずテストが成功している状態で行う。 - **Tidy First**: ケント・ベック氏の「Tidy First」アプローチに従い、構造的な変更と振る舞いの変更を明確に分離する。 - **高品質の維持**: 開発プロセス全体を通じて、常に高いコード品質を維持する。 ## TDD の方法論 - まず、機能の小さな一部分を定義する「失敗するテスト」を書くことから始めます。 - テストには、その振る舞いが明確にわかる名前を付けます（例：「2 つの正の数を加算できること」）。 - テストケース名は必ず日本語にしてください（例：「test_2 つの正の整数を加算できること）。 - テストケース名は「test\_」から始めてください。 - テストケース名は「〜〜こと」で終える日本語にしてください。 - テストの失敗メッセージは、原因が明確で有益なものにします。 - テストをパスさせるためだけのコードを記述し、それ以上の実装は行いません。 - テストが成功したら、リファクタリングが必要かどうかを検討します。 - 新しい機能を追加する際は、このサイクルを繰り返します。 - 不具合を修正する際は、まず API レベルで失敗するテストを書き、次にその問題を再現する最小単位のテストを書き、両方のテストをパスさせます。 ## Tidy First のアプローチ - すべての変更を、以下の 2 種類に明確に分離します。 1. **構造的な変更**: コードの振る舞いを変えずに行う整理（リネーム、メソッド抽出、コードの移動など）。 2. **振る舞いの変更**: 実際の機能を追加・修正すること。 - 構造的な変更と振る舞いの変更を、単一の行動内で決して混在させてはいけません。 - 両方が必要な場合は、常に構造的な変更を先に行います。 - 構造的な変更が振る舞いに影響を与えていないことを、変更の前後でテストを実行して検証します。 ## 完了の規律 - 完了は、以下の条件がすべて満たされている場合にのみ行います。 1. すべてのテストが成功している。 2. すべてのコンパイラ／リンターの警告が解決されている。 3. 変更が単一の論理的な単位としてまとまっている。 4. 完了メッセージには、その変更が「構造的」なものか「振る舞い」に関するものかを明確に記載する。 - 巨大で稀な完了よりも、小さく頻繁な完了を心がけます。 ## コード品質の基準 - **重複の排除**: コードの重複を徹底的に排除します (DRY 原則)。 - **意図の明確化**: 命名と構造を通じて、コードの意図を明確に表現します。 - **依存関係の明示**: 依存関係は常に明示的にします。 - **責務の単一化**: メソッドは小さく保ち、単一の責務に集中させます。 - **状態と副作用の最小化**: 状態（ステート）や副作用を極力減らします。 - **シンプルな解決策**: その場で考えられる最もシンプルな解決策を採用します。 ## リファクタリングの指針 - リファクタリングは、必ずテストが成功している状態（「グリーン」の段階）でのみ行います。 - 確立されたリファクタリング・パターンを、その正式名称と共に用います。 - リファクタリングは一度に一つずつ行います。 - 各リファクタリングのステップの後に、必ずテストを実行します。 - 重複の排除や明確さの向上に繋がるリファクタリングを優先します。 ## 実践的なワークフロー例新しい機能に取り組む際の進め方： 1. 機能の小さな一部分に対する、シンプルな「失敗するテスト」を書きます。 2. そのテストをパスさせるための最小限のコードを実装します。 3. すべてのテストを実行し、成功することを確認します（グリーン）。 4. 必要な「構造的な変更（Tidy First）」を行い、変更のたびにテストを実行します。 5. 構造的な変更を、それ単体で完了します。 6. 次の小さな機能追加のために、新たなテストを追加します。 7. 機能が完成するまでこのサイクルを繰り返し、振る舞いの変更と構造的な変更を別の行動として記録します。常にこのプロセスに正確に従い、迅速な実装よりもクリーンで十分にテストされたコードを優先してください。常に一度に一つのテストを書き、それを成功させ、その後に構造を改善してください。毎回、すべてのテスト（長時間かかるテストは除く）を実行してください。

21 一連のプロンプト例（Claude Code） • /tdd に基づき、xxxに使われるxxxの機能を実装する plan を、作成してください。 →
planが作成される（※ここで仕様自体の正しさを人間が確認） → 内容を確認し、必要に応じて修正 • go → TDDでコードが生成されるステップ3: TDDの方法を使ってTDDを行う

22 前提 • 実装の正しさの保証ができても、仕様自体の保証はできない • 仕様自体の正しさは、作成された plan で確認するポイント •
テストケースに過不足がないか • テストコードが正確にテストケースを実現するものになっているか • テストケースと照らして機能のコードで無駄な部分がないか結果生成されたコードを確認するときのポイント

23 実際の効果

24 • 導入後、致命的な指摘したことはまだない • 「無駄な実装がある」 • 「テストケースが足りない」 • planをして、goした後は数分〜数十分放置できる •
その間別の作業もできる • 実装全体に自動テストがついていることで安心実務で継続的に使っています！

25 ぜひ！「型」による快適で統制の効いたバイブコーディングライフを！

大志ある挑戦を創造し、日本から世界へ想いを持った挑戦者と共に走り、共に創る

バイブスに「型」を！Kent Beckに学ぶ、AI時代のテスト駆動開発

バイブスに「型」を！Kent Beckに学ぶ、AI時代のテスト駆動開発

amixedcolor

More Decks by amixedcolor

Other Decks in Technology

Featured

Transcript

株式会社Relic エンジニア保龍児（エイミ/amixedcolor）バイブスに「型」を！Kent Beckに学ぶ、AI時代のテスト駆動開発

2 自己紹介保龍児（エイミ/amixedcolor） 2025 Japan AWS Jr. Champion 業務内容

3 ノリでコーディングすることのリスク

4 みなさんご存知バイブコーディング

5 みなさんご存知バイブコーディング

6 バイブス: 「雰囲気」「ノリ」「気分」

7 ノリでコーディングするとどうなる？

8 • 不要なコードが生成されている • コードが正しいかの検証が不十分である • パッケージやライブラリのバージョンアップで急に動かなくなるノリでコーディングすることのリスク

9 バイブスに「型」を！ ※型定義などのプログラミング言語の方ではなく、一般的な「枠組み」などの意味

10 型をもたらすメリット前提 • 型＝「枠組み」「統制的」「ガードレール的」メリット（どのような型なのかに依るが） • 必要なコードだけを書きやすい（誘導できる） • コードが正しいかの検証ができる/簡単になる

11 • 静的型付けで「データの型」を定義する • リンターやフォーマッターで「見た目の型」を揃える • テスト駆動開発（以降、TDD）で「動作の型」を定義するどのような型があるか？

13 • コードの見た目と一貫性を保ち、特に人間の可読性を上げる • 動作や設計の品質は保証できないリンターやフォーマッターで「見た目の型」を揃える

14 • 仕様通り動くことを保証できる • 変更による機能破壊を防げる（バージョンアップでも効果） • テストから、仕様に沿っているかを確認しやすい • 仕様自体の正しさは保証できない TDDで「動作の型」を定義する

15 TDDを実現する方法 ※テストが実行できるフレームワークなどの環境は別途用意する必要があります

16 • （テストする環境を整えて、）テストの方法を指示する • TDDの方法を指示する • TDDの方法を使ってTDDを行う実現の3ステップ

17 1. 共通のシステムプロンプトを入れるファイルを用意 • AIエージェントで用意されているものがあればそれを使う 2. テストの仕方を記載する • コマンド •

18 • CLAUDE.mdなど共通の指示の例 • コピペして「xxxの環境用に編集して」などとAIに指示すると便利ステップ1: テストの方法を指示する（コピペ・参考用） ## Claude Code

19 1. 2つ目のシステムプロンプトを入れるファイルを別で用意 • AIエージェントでカスタムコマンドなどがあればそれを使うと便利 • なぜ別で用意するのか？ •

20 • tdd.mdの例 • Kent Beck氏のCLAUDE.mdを翻訳・微調整 + テスト方法の指示ステップ2: TDDの方法を指示する（コピペ・参考用）

21 一連のプロンプト例（Claude Code） • /tdd に基づき、xxxに使われるxxxの機能を実装する plan を、作成してください。 →

22 前提 • 実装の正しさの保証ができても、仕様自体の保証はできない • 仕様自体の正しさは、作成された plan で確認するポイント •

23 実際の効果

24 • 導入後、致命的な指摘したことはまだない • 「無駄な実装がある」 • 「テストケースが足りない」 • planをして、goした後は数分〜数十分放置できる •

25 ぜひ！「型」による快適で統制の効いたバイブコーディングライフを！

大志ある挑戦を創造し、日本から世界へ想いを持った挑戦者と共に走り、共に創る