Cursor SDKで構築した開発ワークフロー

Cursor SDK で構築した開発workflow 運用の顛末 Osaka — Cursor SDK LT
ZOE合同会社栃本和宏 2026-06-10 大阪／ Cursor SDK で workflow を組んで 1 か月運用して見えた改善点・教訓を local runtime 前提で共有 1

自己紹介 2

Cursor SDKとは 2026-04-29 公開。 @cursor/sdk で Cursor の agent runtime
をコードから呼べる。公式説明では、Desktop / CLI / Web と同じ harness を TypeScript から使える実行先は 2 系統 local : 手元の repo を cwd にして動かす cloud : Cursor の専用 VM 上で動かす今回共有するのは local で組んだ workflow の運用知見出典: Cursor 公式ブログ「Build programmatic agents with the Cursor SDK」 3

モチベーションポチポチしたくない不要な承認・確認を求められたくない毎回同じプロンプトをしたくない難易度を考慮したワークフローを自動適用したい安全に並行実装したい 4

前提実装 cursorに実装させた workflowは1日程度で完成したが、試行錯誤を繰り返しまともに動作させるまでに3日以上かかった SDKのドキュメントをmarkdown 化し、リファレンスさせた local を選んだ理由
ローカル repo をそのまま触りたかった既存の認証や開発環境を流用したかった lint / test / typecheck をそのまま回したかった 5

構築したワークフロー一言でいうと GitHub Issue 由来で用意した spec Markdown を入力にして、plan → implement
→ review → verify → report を local runtime で一気通貫に回す workflow を作った。入力 GitHub Issue を元に整えた spec Markdown（ --spec ）必要に応じて PR 文脈も参照 worktree 上のローカル repo 出力実装されたソースコード（repo 内の通常ファイル）各 phase の記録ファイル（後述の artifact フォルダ）プラン・最終レポート（ .cursor/issue-workflow/ 6

workflow 全体像 1 仕様入力 ↓ 2 スナップショット作成 ↓ 3 worktree
検証 ↓ 4 複雑度判定 ↓ 5 計画作成 6 実装 ↓ 7 レビュー ↓ 8 並列検証 ↓ 9 レポート作成 ↓ 10 成果物化対象 spec を固定 1 run 分の記録フォルダを作る編集先と状態を確認軽量か通常経路かを決める実装方針を固める仕様に沿って変更する合否を機械判定する lint / test / typecheck checkpoint を更新必要なら PR まで進める 7

補足: artifact（成果物フォルダ）とは？ artifact = workflow を 1 回回すたびに作る記録用フォルダ。エージェントが書き換えたアプリのコードそのものではなく、「その
run で何が起きたか」を残すためのファイル群。入るもの（例） spec.snapshot.md — 入力 spec のコピー plan-review.md — レビュー文と *_DECISION 行 verify-attempt-1.md — lint / test のログ workflow-checkpoint.json — 置き場所・性質既定: .cursor/issue- workflow/sdk-spec-workflow-< 実行時刻>/ プラン・レポートは同階層の sdk- spec-plan-*.md 等 .gitignore 済み → ローカルの作業ログ 8

Step 2: スナップショット作成ここでやることこの run 専用の artifact フォルダを作成し、パスを固定する入力
spec を spec.snapshot.md としてフォルダ内にコピーする resume 時は同じフォルダを開き、スナップショットと元 spec が一致するか確認する概要この step は「準備」ではなく、以後の判断基準を固定する step ここを曖昧にすると、resume 時に別 spec を読んでしまう local workflow では最初の入力固定がかなり重要だった単に「spec をコピーする」だけではなく、以後の全 step が同じ spec を見るための固定点になっている。根拠: core/workflow-core.ts の initializeContext 9

Step 3: worktree 検証ここでやること今いる場所が main clone ではなく、想定した worktree
かを先に止める branch / path / marker を突き合わせ、ズレたら即失敗にする「作った worktree」と「今開いている workspace」が一致するかを見る概要 worktree を作るだけでは事故は防げなかった local.cwd 依存の編集先ズレは、preflight で締める必要があった local runtime の安全性は SDK ではなく周辺設計で担保した根拠: core/preflight.ts 。単なる yes/no 判定ではなく、失敗理由も残す。 10

Step 4: 複雑度判定ここでやることこの spec を軽量経路で回せるか、重い経路で回すべきかを先に決める判定結果で plan を省略するか、通常どおり作るかを分ける
workflow 全体のコスト配分をここで調整する概要判定が壊れても workflow は止めず、安全側の重い経路へ倒す軽量化の判定は便利だが、壊れたときに軽量側へ倒さないのが重要だった省略の判断ほど、保守的に扱った方が安定した根拠: core/complexity-assess.ts 。壊れたら軽量側へは倒さない。 11

Step 10: 成果物化ここでやること report、checkpoint、差分証跡を残して、人が引き取れる状態にする verify が通ったあとも、最後に「何が起きたか」を成果物化する必要なら PR 作成までつなぐ
概要 workflow の出口は「実装完了」ではなく「扱える成果物」だった自動 commit / PR も入れたが、危険ファイルは止める前提にした最後の step は便利機能というより、引き渡し設計の話根拠: core/workflow-core.ts , core/report.ts , core/post-success-pr.ts 。この step は人に返せる形で終わらせるための出口。 12

技術仕様項目値補足 @cursor/sdk 1.0.12 vendor/cursor-sdk-spec-workflow で使用 Node.js 22.17.0
repo の Volta pin。 engines は >=22 TypeScript 5.7.3 workflow package 側の固定 version workflow package cursor-sdk-spec- [email protected] vendor 配下に内包実行入口 pnpm cursor:sdk:spec- workflow 実体は scripts/run-sdk-spec- workflow.sh 前提だけ補足すると、 worktree 必須、verify は lint / typecheck / test を並列実行。各 phase のレビュー文・検証ログ・checkpoint は artifact フォルダに、プランと最終レポートは .cursor/issue- workflow/ に保存する。 13

設計上の考慮ポイント 14

設計上の留意点1 ループをどこに置くかを先に決めるこの workflow で置いたループ plan review が落ちたときだけ、phase1 で plan
修正ループを回す実装後は scope completion / review / verify で別々に戻し先を持つどこでも同じ prompt を再実行するのではなく、戻す phase を固定する主眼仕様解釈の修正は実装前に閉じる品質修正は review / verify の後段で閉じる無人運用では「どこへ戻すか」を曖昧にしない方が安定した 15

設計上の留意点2 何回まで許容するかを固定する制御点この実装の既定値意図 SDK 呼び出し retry 3 回まで
一時的な通信揺らぎだけを少数回だけ救う plan re-review loop standard は 1 回、 thorough は 2 回実装前の仕様修正を無限にしない verify fix loop 2 回までテスト修正は回すが、直らなければ失敗として残す根拠: core/params.ts , core/workflow-core.ts 。「とりあえず何度でもやり直す」より、直る見込みが高いものだけ少数回に制限する方が扱いやすかった。 16

設計上の留意点3 retry / diagnostics / resume を混ぜない分けたもの一時エラーは retry
run.wait() が finished 以外で終わったら diagnostics を残す途中再開は checkpoint から resume 主眼再試行すべき失敗と、調べるべき失敗は別 resume は retry の延長ではなく、phase 再開の設計失敗の種類ごとに出口を分けた方が保守しやすい 17

設計上の留意点まとめ検討項目考慮しないとどうなるか loop を置く phase 実装前の仕様修正と、実装後の品質修正が混ざり、どこへ戻すべきかが曖昧になる retry /
fix の打ち切り回数直る見込みが低い失敗まで回し続け、長時間化した末に失敗理由もぼやけやすい retry / diagnostics / resume の境界再試行すべき失敗と調査すべき失敗が混ざり、障害時の次の一手を決めにくくなる plan 省略や軽量化の条件判定が壊れたときに軽量側へ倒れ、確認不足のまま後続 phase が進みやすくなる 18

運用の考慮ポイント 19

運用上のポイント1 通信揺らぎと実行崩壊を分けて扱う症状 / 根本原因 models.list や step 実行が一時的な通信揺らぎで失敗する
run.wait() が finished 以外を返し、そのままだと何が起きたか分からない「ネットワーク断」と「agent 実行崩壊」が同じ失敗に見えていた対策 / 教訓 retry 可能なエラーだけ指数バックオフで再試行 run.wait() 異常は JSON diagnostics を artifact フォルダに保存通信揺らぎへの retry と、 run.wait() 異常時の診断を分けて設計する 20

技術ポイント: 失敗を 1 種類として扱わないこのスライドで言いたいこと「失敗したらとりあえずリトライ」では足りない。どの種類の失敗かで、やるべき対処を分ける必要がある。何が起きたかどう対処するか具体例
一時的な通信揺らぎ retry models.list 失敗、接続 timeout run.wait() が finished 以外で終わる diagnostics を残す SDK 実行の状態を JSON で残す途中で落ちて続きからやりたい resume 前回の artifact フォルダを指定して -- resume-from この 3 つを同じ「エラー処理」にまとめると、障害時に何をすべきかが曖昧になる。 local workflow では、再試行する失敗と調べるべき失敗と再開すべき失敗を分けた方が運用しやすかった。 21

運用上のポイント2 編集先の誤りをどう防ぐか症状 / 根本原因 worktree を作ったのに、編集が main clone 側へ入る事故が起きた
local.cwd は「今開いている workspace」に依存する緊急回避フラグで preflight をバイパスできる経路もあった対策 / 教訓 git-dir != git-common-dir 、 marker、basename で多重チェック shell 実行前フックと sessionStart でも警告 worktree 作成と workspace 切替を別問題として扱う 22

技術ポイント: local.cwd だけでは安全ではない worktree を作ったとその worktree を開いているは別
だから cwd だけではなく、 preflight shell hook sessionStart reminder の三重で縛った local runtime は便利だが、編集先保証は SDK 任せにしない方がよい。 23

運用上のポイント3 失敗原因を追える状態を残す症状 / 根本原因以前は「失敗した」という事実しか残らなかった phase 失敗、wait 異常、preflight
失敗が同じ見え方だった対策 / 教訓 bootstrap failure report と workflow failure report を分離 wait 異常は専用 JSON を出力失敗の種類ごとに artifact 内のファイルを分ける（bootstrap / wait / phase 別） 24

運用上のポイント4 途中再開を前提に checkpoint を持つやったこと phase 境界ごとに workflow-checkpoint.json を更新し、 --resume-from
で再開できるようにした。 phase2 完了 -> workflow-checkpoint.json -> suggestedResumeFrom: phase3-review resume は「エージェントの会話をそのまま続ける」のではなく、前回と同じ artifact フォルダ（spec スナップショット・レビュー結果・checkpoint）を読み直して、指定 phase からやり直す仕組み。 25

SDKで構築するメリット・デメリット 26

メリット効率化 - いつもの実装手順の繰り返しがなくなる開発の手順をワークフロー化する事ができる headlessであるため、不要な承認作業が不要になる予め操作を禁止設定しておく必要があるが、適切に使用すれば安全に使用できるプロセス改善ができる
プロセス（ワークフロー）がコードとして保持されるため、改修を続けることで改善していくことができる 27

デメリット構築コストメンテナンスコスト安全性 local agent のデフォルトは、sandboxOptions.enabled=false / local.autoReview=false のように設定されており、アクセス制限が緩く、
Auto-review 分類器も通さないため、permissions.jsonなどでブロックする or デフォルト設定を変更する必要がある 28

まとめ有用性の確認と今後の課題 cloudモードで実行することで、開発の幅が広がりそうです様々なモデルを組み合わせるような開発スタイルに向いている気がしましたうまく使うことで、実装のプロンプトや承認を効率化・自動化することができます個人的には、もっと良いやり方があるような気がしており、改善していきたいと思います Cursor SDK
自体は数行で起動できる。実運用で差が出るのは、その周辺にどれだけ再発防止と診断を積めるかだった。 29

付録 Cursor SDK と Cursor Harness の関係 30

Harness とは何か公式の言い方では、Harness = Cursor のエージェント実行基盤。 Desktop / CLI /
Web / SDK が同じ中身を共有する。 Harness が担うこと（エンジン側）モデル呼び出しとエージェントループ索引・grep・セマンティック検索ファイル編集・シェル等のツール実行 Skills / MCP / Hooks / Subagents local / cloud のruntime 出典: Cursor 公式ブログ — *Use the full Cursor harness* 31

SDK と Harness — レイヤー Cursor SDK = Harness を起動・監視する
API。 Cursor Harness = エージェントを動かす実行エンジン。 SDK は別物ではなく、同じ Harness へのリモコンに近い。 ┌──────────────────────────────────┐ │ workflow（phase・ゲート・resume） │ └───────────────┬──────────────────┘ │ create / send / wait ┌───────────────▼──────────────────┐ │ Cursor SDK（@cursor/sdk） │ └───────────────┬──────────────────┘ │ ┌───────────────▼──────────────────┐ │ Cursor Harness（共通 runtime） │ │ モデル・ツール・Skills・MCP 等 │ └──────────────────────────────────┘ IDE チャットも agent.send() も、下では同じ Harness。 32

Harness が SDK 経由でも効くもの仕組み Harness 側 SDK から Skills
.cursor/skills/ cwd の repo から読込 MCP .cursor/mcp.json inline で上書き可 Hooks .cursor/hooks.json ファイル管理（API なし） Subagents .cursor/agents/ Agent ツールで委任 Models frontier モデル群 model.id で切替今回の workflow で体感したこと .cursor/skills/ や Hooks は SDK local でもそのまま効いた Harness が自動ではやらないのは phase 順・打ち切り・worktree 安全 Harness = 1 回の agent 実行、workflow = その外側 SDK 公式: *same harness that powers Cursor across desktop, CLI, and web app* 33

ソースコード cursor-sdk-spec-workflow 今回紹介した workflow の実装本体（TypeScript / @cursor/sdk ） https://github.com/zoe-llc/cursor-sdk-spec-workflow 項目
値コード数 TypeScript 6,734 行（本体） / 9,060 行（テスト含む）ファイル数 40（ .git 除く）フォルダ構成 cursor-sdk-spec-workflow/ ├── core/ … phase 実行・verify・preflight 等 ├── shared/ … retry / env 等 ├── __tests__/ … Jest ├── test-fixtures/ ├── .cursor/skills/ … Agent Skill ├── index.ts … エントリ └── connection-check.ts 34

ポチポチを撲滅したい 35

Cursor SDKで構築した開発ワークフロー

Cursor SDKで構築した開発ワークフロー

kaz toc

More Decks by kaz toc

Other Decks in Technology

Featured

Transcript

Cursor SDK で構築した開発workflow 運用の顛末 Osaka — Cursor SDK LT

自己紹介 2

Cursor SDKとは 2026-04-29 公開。 @cursor/sdk で Cursor の agent runtime

モチベーションポチポチしたくない不要な承認・確認を求められたくない毎回同じプロンプトをしたくない難易度を考慮したワークフローを自動適用したい安全に並行実装したい 4

前提実装 cursorに実装させた workflowは1日程度で完成したが、試行錯誤を繰り返しまともに動作させるまでに3日以上かかった SDKのドキュメントをmarkdown 化し、リファレンスさせた local を選んだ理由

構築したワークフロー一言でいうと GitHub Issue 由来で用意した spec Markdown を入力にして、plan → implement

workflow 全体像 1 仕様入力 ↓ 2 スナップショット作成 ↓ 3 worktree

補足: artifact（成果物フォルダ）とは？ artifact = workflow を 1 回回すたびに作る記録用フォルダ。エージェントが書き換えたアプリのコードそのものではなく、「その

Step 2: スナップショット作成ここでやることこの run 専用の artifact フォルダを作成し、パスを固定する入力

Step 3: worktree 検証ここでやること今いる場所が main clone ではなく、想定した worktree

Step 4: 複雑度判定ここでやることこの spec を軽量経路で回せるか、重い経路で回すべきかを先に決める判定結果で plan を省略するか、通常どおり作るかを分ける

Step 10: 成果物化ここでやること report、checkpoint、差分証跡を残して、人が引き取れる状態にする verify が通ったあとも、最後に「何が起きたか」を成果物化する必要なら PR 作成までつなぐ

技術仕様項目値補足 @cursor/sdk 1.0.12 vendor/cursor-sdk-spec-workflow で使用 Node.js 22.17.0

設計上の考慮ポイント 14

設計上の留意点1 ループをどこに置くかを先に決めるこの workflow で置いたループ plan review が落ちたときだけ、phase1 で plan

設計上の留意点2 何回まで許容するかを固定する制御点この実装の既定値意図 SDK 呼び出し retry 3 回まで

設計上の留意点3 retry / diagnostics / resume を混ぜない分けたもの一時エラーは retry

設計上の留意点まとめ検討項目考慮しないとどうなるか loop を置く phase 実装前の仕様修正と、実装後の品質修正が混ざり、どこへ戻すべきかが曖昧になる retry /

運用の考慮ポイント 19

運用上のポイント1 通信揺らぎと実行崩壊を分けて扱う症状 / 根本原因 models.list や step 実行が一時的な通信揺らぎで失敗する

技術ポイント: 失敗を 1 種類として扱わないこのスライドで言いたいこと「失敗したらとりあえずリトライ」では足りない。どの種類の失敗かで、やるべき対処を分ける必要がある。何が起きたかどう対処するか具体例

運用上のポイント2 編集先の誤りをどう防ぐか症状 / 根本原因 worktree を作ったのに、編集が main clone 側へ入る事故が起きた

技術ポイント: local.cwd だけでは安全ではない worktree を作ったとその worktree を開いているは別

運用上のポイント3 失敗原因を追える状態を残す症状 / 根本原因以前は「失敗した」という事実しか残らなかった phase 失敗、wait 異常、preflight

運用上のポイント4 途中再開を前提に checkpoint を持つやったこと phase 境界ごとに workflow-checkpoint.json を更新し、 --resume-from

SDKで構築するメリット・デメリット 26

デメリット構築コストメンテナンスコスト安全性 local agent のデフォルトは、sandboxOptions.enabled=false / local.autoReview=false のように設定されており、アクセス制限が緩く、

付録 Cursor SDK と Cursor Harness の関係 30

Harness とは何か公式の言い方では、Harness = Cursor のエージェント実行基盤。 Desktop / CLI /

SDK と Harness — レイヤー Cursor SDK = Harness を起動・監視する

Harness が SDK 経由でも効くもの仕組み Harness 側 SDK から Skills

ソースコード cursor-sdk-spec-workflow 今回紹介した workflow の実装本体（TypeScript / @cursor/sdk ） https://github.com/zoe-llc/cursor-sdk-spec-workflow 項目

ポチポチを撲滅したい 35