Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2025.10.28_CodexとClaude Codeの比較検討 社内座談会

2025.10.28_CodexとClaude Codeの比較検討 社内座談会

こちらのイベント資料です
https://yojo.connpass.com/event/370396/

More Decks by PharmaX(旧YOJO Technologies)開発チーム

Transcript

  1. (C)PharmaX Inc. 2023 All Rights Reserve 2 ご案内事項 • ご質問はZoomの「Q&A」よりお願いします

    • 質疑応答のお時間は、発表のあとにとらせていただきます • 「Q&A」におきましては、暴力的・差別的・反社会的な表現や、他人に不快感を与える表現は禁 止とさせていただきます。 • 今回のイベントに関係のないご質問やお問い合わせ等につきましては、発表者や他の参加者へ の妨げになりますので「 Q&A」への投稿はご遠慮お願いします。 • 上記事項に反していると運営側で判断した場合は、個別に退室処理をさせていただく場合がご ざいますのでご了承ください 質疑について その他
  2. (C)PharmaX Inc. 2025 All Rights Reserve 3 自己紹介 X:@ueeeeniki 上野彰大

    PharmaX共同創業者・CTO 好きな料理はオムライスと白湯とコーラ 『LLMアプリケーションの評価と継続的改善』についての本を 執筆中!!
  3. (C)PharmaX Inc. 2025 All Rights Reserve 4 自己紹介 尾崎皓一 PharmaX

    YOJOカンパニー CTO 2人目のエンジニア正社員としてジョイン 最近はAIコーディングを活用しながらがっつりコーディング もしています X(Twitter):@FooOzaki
  4. (C)PharmaX Inc. 2025 All Rights Reserve 5 自己紹介 江田知優 PharmaX

    AX事業 エンジニア インターンののち、新卒入社。 現在入社3年目。 プロダクト開発の傍ら AIコーディングエージェントを使って 開発フローの自動化に取り組んでいます! X(Twitter):@asamuzakE
  5. (C)PharmaX Inc. 2025 All Rights Reserve 8 医療業界を横断する 2つの事業領域 YOJO

    toC事業 BtoC/BtoB両事業でAIエージェントを実装することで患者満足度世界一の医療体験を実現 AX toB事業 “まだ誰も見たことのない ”10Xな医療体験の実現 既存医療インフラの AIによる劇的なアップデート
  6. (C)PharmaX Inc. 2025 All Rights Reserve 9 医療アドバイザーに体調 のことをいつでも気軽に相 談できる

    相談型医療体験 30種類以上の漢方薬からあ なたに合ったものを月毎に 提案 パーソナライズ漢方薬 定期的に漢方をお届けし、 一人ひとりに寄り添うかか りつけ医療を提供 継続的なかかりつけ 一生涯にわたって寄り添うかかりつけ漢方薬局「 YOJO」
  7. (C)PharmaX Inc. 2025 All Rights Reserve 11 YOJOで稼働する OTC医薬品相談 AIエージェント

    患者さまからの一次対応をすべて AIエージェントが行う(裏側では 100近いのプロンプトが稼働) 基本的にはメッセージを自動送信し、必要があれば薬剤師に承認を求める 一次的な漢方選択や、こちらから送信する体調確認などもエージェントが自律的に作成 薬剤師に重要な 返信や判断の確認を依頼 一次的な漢方選択なども行う 薬剤師が返信する場合もある AIエージェント 薬剤師 ユーザー AIが人に指示をするような体験
  8. (C)PharmaX Inc. 2025 All Rights Reserve 13 PharmaXでの利用状況 • Claude

    Codeをこれまでメイン利用 • CodexはCLI版のみを数ヶ月ほど利用 ◦ 実務でも導入し、試してみ始めている • PRレビューは Gemini Code Assistをメイン利用 ◦ セルフレビュー機構として他モデルも利用 • 開発を完全自動化できないかなどチャレンジングな試みもしてきたが一定の 限界を感じている ◦ 直近はClaude Codeベースでワークフローを構築していたので本日は Claude Codeの話が多めになるかも ※PharmaX社内の利用事例ベースでの座談会になるのでテーマに少し偏りが出るかもしれませ んがご容赦ください!
  9. (C)PharmaX Inc. 2025 All Rights Reserve 14 CodexとClaude Codeの概要 Claude

    Code(Anthropic) Codex(OpenAI) モデル Claude(Opus, Sonnet Haiku) Sonnet 4.5がデフォルト gpt-5-codex(low, medium, high) gpt-5(low, medium, high) 動作環境(CLI/ ターミナル) ◯ ネイティブなターミナルインター フェースを提供 ◯ Codex CLIとしてターミナルから利用可能 動作環境 (クラウド) ▲ ※Claude Code on the webの ベータ版提供開始 ◯ Codex Web エフェメラル(短命)な Linuxサンドボックスで動作 高度な カスタマイズ性 ◎ hooks、サブエージェントなど ▲ 基本的にはサードパーティツールや mcpにてカスタマイズ コンテキストウィン ドウ ◯ 200K ◎ 400K(input: 272K + output: 128K )
  10. (C)PharmaX Inc. 2023 All Rights Reserve 15 座談会テーマ CodexとClaude Codeの性能/モデル性能について

    ・開発フェーズごとに得意・不得意は感じるか? ・大きなタスク複雑なタスクの精度は? ・細かいコーディングの精度は?
  11. (C)PharmaX Inc. 2025 All Rights Reserve 17 (参考)過去の取り組み事例 Roo Codeはワークフローを定義すれば、モードを自動で切り替えるようになっている

    ワークフローに従って 勝手にモードが切り替わる モードごとにプロンプトが変わっ たほうが制御できる Claude Codeなども結局は似た ような思想にたどり着きつつある ように感じる
  12. (C)PharmaX Inc. 2025 All Rights Reserve 19 Claude Codeのサブエージェント① •

    特定のロールを与えたClaude Codeエージェン トを作成可能 • 独立したコンテキストウィンドウを利用し、別ウィ ンドウで動作する
  13. (C)PharmaX Inc. 2025 All Rights Reserve 20 Claude Codeのサブエージェント② •

    メインセッションからカスタマイズしたサブエージェ ントにタスク委任が可能 • 自動委任:Claude.mdなどに記載することで自 律的にメインプロセスからサブエージェントを利用 することも可能
  14. (C)PharmaX Inc. 2025 All Rights Reserve 22 サブエージェント活用例 サブエージェントとhooksを使って、コミット前にコード規約をチェック hooksでコマンド実行

    ↓ コード規約チェックのサブエージェント起動するように出力 ↓ claude codeがサブエージェントを起動
  15. (C)PharmaX Inc. 2025 All Rights Reserve 23 ワークフローや自動化に関する手法整理 Claude Code(Anthropic)

    Codex(OpenAI) ※Claude Codeでも同様のことは可能 役割・ 専門化の定義 サブエージェント機能にて標準機能で実現 可能 ワーキングディレクトリやセッションを分けて 個別にプロンプトもしくは AGENTS.mdで指示 タスク委譲(サ ブタスク実行) メインプロセスからサブエージェントを起 動可能 Claude.mdによる指示だけでは意図通りに起動し てくれないことも... メインプロセスから実行するにはMCP として登録する必要あり サードパーティーツールなどで MCPとしてCodexを 立ち上げるツールなどは存在する フロー構築 フロー定義のベースはプロンプトエンジニ アリング Hooks機能などによりコールバックが可能 タスク委譲の柔軟性によりシンプルに構築可能 フロー定義のベースはプロンプトエンジニ アリング タスク委譲のしにくさもあり、スクリプトなどによる ワークフロー構築が必要なシーンも
  16. (C)PharmaX Inc. 2025 All Rights Reserve 26 現時点でのサブエージェントに関する所感 コンテキストが欠落することでサブエージェントができる仕事には限界がある •

    現時点のサブエージェントの性能・仕組みでは、コンテキストがなくてもこなせるタスクをサブ エージェントに任せるという限定的な使い方になってしまっている ◦ コンテキストが圧縮される影響がかなり大きく、複雑なコンテキストを引き継がなければな らないタスクを任せるのが難しいのが現状 • であれば、別にタスクを切って新しいエージェントを立ち上げるのと正直あまり変わらない ◦ Codexはどちらかというとそれでいいじゃんという思想に感じる ◦ 前述したようにhooksで決まったサブエージェントを呼び出すのは便利ではあるが、新し いエージェントの立ち上げを自動化してくれているのと変わらない
  17. (C)PharmaX Inc. 2025 All Rights Reserve 27 どうすればサブエージェントがワークするか サブエージェントをワークさせるにはメモリー化の仕組みをもっとうまく活用する仕組みが必要 •

    タスクが非常にうまく切られていて、コンテキストをほとんど共有せずに各サブエージェントが自 分のタスクを完遂できる場合 ◦ ただし、この場合も複数のClaude Codeを立ち上げるのとあまり変わらない • ドキュメント(メモリー)の仕組みがワークして、サブエージェントがドキュメントを更新して、メイ ンプロセスのエージェントはそのドキュメントを参照してということをうまく繰り返すことができれ ばワークする可能性あり ◦ コンテキストが落ちないようにドキュメントする必要がある
  18. (C)PharmaX Inc. 2025 All Rights Reserve 28 今後どのようにコーディング AIエージェントが進化して欲しいか 結局は、コンテキストサイズとマルチターン性能が向上するのが一番嬉しいというだけな気もする

    • できる限りコンテキストを保持した方がいいのであれば、コンテキストサイズの増加・マルチ ターン性能の向上すればいいという元も子もない結論ではないか ◦ 直近で言えば、コンテキストサイズは 500万トークン、100ターンは精度が落ちない程度マ ルチターン性能があれば十分ではないか • そして、それは技術的な問題ではなくインフラ等の問題で制限がかかっている可能性もある https://www.youtube.com/watch?v=mYDSSRS-B5U
  19. (C)PharmaX Inc. 2025 All Rights Reserve 29 こういう仕組みは有用なのでは? (コンテキストが限定されている現在では)寄り道をする仕組みはあってもいい コンテキストに残しておく必要のない作業はある

    例) • 途中で気になったことのリファクタ • 調査系(既存コードやライブラリの仕様など) • 静的解析やテストの実行(ログのほとんどは不要) • コード規約のレビュー
  20. (C)PharmaX Inc. 2025 All Rights Reserve 30 Codex vs Claude

    Code まとめ • 得意不得意があり、タスク特性によってそれぞれ優位になり得るので、精度はさして変わらな い → 好みでいいくらい • タスクをまるっと任せるならCodex, カスタマイズして精緻にやるなら Claude Code • PharmaXとしてはしばらく両方つかってみる 今時点では明確に優劣をつけられないというのが正直なところ