From 1cbb859c9177f551488e98dbeae350c8d8549391 Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 14:55:35 -0700
Subject: [PATCH 1/9] =?UTF-8?q?docs(canvas):=20add=20Phase=202=20plan=20?=
 =?UTF-8?q?=E2=80=94=20SSE=20run=20panel?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Five-part plan covering SSE service layer, RunSlice state machine,
run button with validation, run panel with node highlighting, and
reconnection with human-in-the-loop resume. Two review passes
addressed race conditions (terminal event + onerror, concurrent
reconnection), auth via Vite proxy, and Sheet bottom variant.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 .claude/gw-plans/canvas/README.md             |   2 +-
 .../canvas/phase-2-sse-run-panel/overview.md  |  46 +++
 .../phase-2.1-sse-service-layer.md            | 280 +++++++++++++
 .../phase-2.2-run-slice.md                    | 373 ++++++++++++++++++
 .../phase-2.3-run-button-validation.md        | 234 +++++++++++
 .../phase-2.4-run-panel.md                    | 310 +++++++++++++++
 .../phase-2.5-reconnection-resume.md          | 264 +++++++++++++
 7 files changed, 1508 insertions(+), 1 deletion(-)
 create mode 100644 .claude/gw-plans/canvas/phase-2-sse-run-panel/overview.md
 create mode 100644 .claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.1-sse-service-layer.md
 create mode 100644 .claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.2-run-slice.md
 create mode 100644 .claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.3-run-button-validation.md
 create mode 100644 .claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.4-run-panel.md
 create mode 100644 .claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.5-reconnection-resume.md

diff --git a/.claude/gw-plans/canvas/README.md b/.claude/gw-plans/canvas/README.md
index f37d2e6..357c1b8 100644
--- a/.claude/gw-plans/canvas/README.md
+++ b/.claude/gw-plans/canvas/README.md
@@ -7,7 +7,7 @@ React 19 + React Flow frontend phases. Depends on execution phases 3-4 for API s
 | Phase | Plan | Status |
 |-------|------|--------|
 | 1 | [Canvas core](phase-1-canvas-core/overview.md) -- Home view, Start/LLM/End nodes, edge wiring, config panel, save/load | Complete |
-| 2 | SSE run panel -- stream display, node highlighting, reconnection | Not started |
+| 2 | [SSE run panel](phase-2-sse-run-panel/overview.md) -- SSE streaming, run panel, node highlighting, reconnection, resume | Planned |
 | 3 | Full node set -- Tool/Condition/HumanInput nodes, settings page | Not started |
 | 4 | Validation, run input modal, state panel | Not started |
 | 5 | Error handling, run history, debug panel, JSON schema panel | Not started |
diff --git a/.claude/gw-plans/canvas/phase-2-sse-run-panel/overview.md b/.claude/gw-plans/canvas/phase-2-sse-run-panel/overview.md
new file mode 100644
index 0000000..71a0a8e
--- /dev/null
+++ b/.claude/gw-plans/canvas/phase-2-sse-run-panel/overview.md
@@ -0,0 +1,46 @@
+# Canvas Phase 2 — SSE Run Panel
+
+## Goal
+
+Wire the canvas to the execution backend so users can run a graph and watch
+it execute in real time. Node-by-node SSE streaming, active node highlighting,
+reconnection, and human-in-the-loop resume.
+
+## What already exists
+
+| Layer | Status |
+|-------|--------|
+| Execution API (`POST /v1/graphs/{id}/run`, `GET /v1/runs/{id}/stream`, resume, cancel, status) | Fully implemented |
+| SSE event types (`@shared/events` — 7 event types) | Defined |
+| `runs.ts` API stub | Skeleton — wrong URL path, no reconnection |
+| `runSlice.ts` store stub | Skeleton — all action bodies are TODOs |
+| `CanvasHeader` | No run button yet |
+| `Sheet` UI component | Supports right/left — needs bottom |
+| `UISlice.panelLayout` | Already tracks `"right" \| "bottom"` |
+| Node pulse CSS | Documented in gw-frontend skill, not yet implemented |
+
+## Parts
+
+| Part | Summary | Depends on |
+|------|---------|------------|
+| 2.1 | [SSE service layer](phase-2.1-sse-service-layer.md) — EventSource wrapper with reconnection, correct API paths, typed event parsing | — |
+| 2.2 | [RunSlice implementation](phase-2.2-run-slice.md) — Full state machine, event dispatch, start/cancel/resume actions | 2.1 |
+| 2.3 | [Run button + validation](phase-2.3-run-button-validation.md) — CanvasHeader run button, client-side validation, run input dialog | 2.2 |
+| 2.4 | [Run panel + node highlighting](phase-2.4-run-panel.md) — Bottom/right panel with event timeline, active node pulse on canvas | 2.2 |
+| 2.5 | [Reconnection + resume UI](phase-2.5-reconnection-resume.md) — Full reconnection state machine with backoff, human-in-the-loop resume form | 2.1, 2.4 |
+
+## Out of scope (Phase 3+)
+
+- Tool/Condition/HumanInput node components (Phase 3)
+- Debug panel with per-node state inspection (Phase 5)
+- Run history list (Phase 5)
+- Run input modal with schema-driven form fields (Phase 4)
+
+## Architecture constraints
+
+- Components read store only — no `fetch()`, no API imports
+- `runSlice` calls `@api/runs` — owns SSE lifecycle
+- `EventSource` is managed by the service layer, not the store
+- Reconnection uses `Last-Event-ID` for server-side replay
+- All API path params use `encodeURIComponent()`
+- Toast for errors via `useUIStore.getState().showToast()`
diff --git a/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.1-sse-service-layer.md b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.1-sse-service-layer.md
new file mode 100644
index 0000000..a634158
--- /dev/null
+++ b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.1-sse-service-layer.md
@@ -0,0 +1,280 @@
+# Phase 2.1 — SSE Service Layer
+
+## Goal
+
+Replace the `runs.ts` stub with a production-ready SSE service layer that
+handles typed event parsing, reconnection via `Last-Event-ID`, and clean
+teardown.
+
+## Files to modify
+
+| File | Action |
+|------|--------|
+| `packages/canvas/src/api/runs.ts` | Rewrite |
+| `packages/canvas/src/api/client.ts` | Export `apiUrl()` helper |
+
+## Design
+
+### `apiUrl()` helper
+
+The base `request()` in `client.ts` already uses `BASE_URL = "/api"`. SSE
+uses `EventSource` which doesn't go through `request()`, so we export a
+shared `apiUrl(path)` function.
+
+```typescript
+// client.ts
+const BASE_URL = "/api";  // existing — Vite proxy rewrites /api → /v1
+
+export function apiUrl(path: string): string {
+  return `${BASE_URL}${path}`;
+}
+```
+
+Refactor `request()` to use `apiUrl()` internally. The `/api` prefix is
+critical — it routes through the Vite dev proxy (which rewrites `/api` to
+`/v1` and forwards to `localhost:8000`). In production, the reverse proxy
+does the same. **Never use `http://localhost:8000/v1` directly** — that
+bypasses the proxy and breaks EventSource auth.
+
+### `runs.ts` — five exports
+
+```typescript
+// 1. Start a run — POST /api/graphs/{graph_id}/run
+export async function startRun(
+  graphId: string,
+  input?: Record<string, unknown>,
+): Promise<{ run_id: string; status: string }>
+
+// 2. Connect to SSE stream — GET /api/runs/{run_id}/stream
+//    Returns a cleanup function. Caller provides typed handlers.
+export function connectStream(
+  runId: string,
+  handlers: StreamHandlers,
+  lastEventId?: number,
+): () => void
+
+// 3. Resume a paused run — POST /api/runs/{run_id}/resume
+export async function resumeRun(
+  runId: string,
+  input: unknown,
+): Promise<{ status: string }>
+
+// 4. Cancel a run — POST /api/runs/{run_id}/cancel
+export async function cancelRun(runId: string): Promise<void>
+
+// 5. Get run status — GET /api/runs/{run_id}/status
+export async function getRunStatus(
+  runId: string,
+): Promise<RunStatusResponse>
+```
+
+### `StreamHandlers` type
+
+```typescript
+export interface StreamHandlers {
+  onEvent: (event: GraphEvent, eventId: number | null) => void;
+  onError: (error: Error) => void;
+}
+```
+
+Note: **No `onClose` handler.** `EventSource` has no native close event.
+When the server ends the stream, EventSource fires `onerror`. Terminal
+events (`graph_completed`, non-recoverable `error`) are detected by the
+store via `_handleEvent`, not via a separate close signal.
+
+### `startRun` implementation
+
+```typescript
+export async function startRun(
+  graphId: string,
+  input?: Record<string, unknown>,
+): Promise<{ run_id: string; status: string }> {
+  return request<{ run_id: string; status: string }>(
+    `/graphs/${encodeURIComponent(graphId)}/run`,
+    {
+      method: "POST",
+      body: JSON.stringify({ input: input ?? {} }),
+    },
+  );
+}
+```
+
+Note: The `input` value is wrapped in `{ input: ... }` to match the server's
+`StartRunRequest` schema. Encoding happens here in the service layer —
+callers pass raw IDs.
+
+### `connectStream` implementation
+
+```typescript
+export function connectStream(
+  runId: string,
+  handlers: StreamHandlers,
+  lastEventId?: number,
+): () => void {
+  const encoded = encodeURIComponent(runId);
+  const params = lastEventId != null ? `?last_event_id=${lastEventId}` : "";
+  const url = apiUrl(`/runs/${encoded}/stream${params}`);
+
+  const source = new EventSource(url);
+
+  // Listen for each known event type (server sends typed SSE events)
+  const EVENT_TYPES = [
+    "run_started", "node_started", "node_completed",
+    "edge_traversed", "graph_paused", "graph_completed", "error",
+  ] as const;
+
+  for (const type of EVENT_TYPES) {
+    source.addEventListener(type, (e: MessageEvent) => {
+      const eventId = e.lastEventId ? Number(e.lastEventId) : null;
+      try {
+        const data = JSON.parse(e.data);
+        handlers.onEvent({ event: type, data } as GraphEvent, eventId);
+      } catch {
+        // Malformed SSE data — skip event, don't crash
+      }
+    });
+  }
+
+  source.onerror = () => {
+    source.close();
+    handlers.onError(new Error("SSE connection lost"));
+  };
+
+  return () => {
+    source.close();
+  };
+}
+```
+
+Key decisions:
+- **Named event listeners** (`addEventListener(type, ...)`) instead of
+  `onmessage` because the server sends typed SSE events (`event: node_started`),
+  not generic `message` events.
+- **`eventId` passed to handler** so the store can track `lastEventId` for
+  reconnection replay.
+- **No auto-reconnect** — `EventSource` has built-in reconnection but we
+  disable it (close on error) because the reconnection state machine in
+  `runSlice` needs to control backoff and status-check logic.
+- **JSON parse errors caught** — malformed data is silently skipped rather
+  than crashing the event loop.
+
+### `resumeRun` implementation
+
+```typescript
+export async function resumeRun(
+  runId: string,
+  input: unknown,
+): Promise<{ status: string }> {
+  return request<{ status: string }>(
+    `/runs/${encodeURIComponent(runId)}/resume`,
+    {
+      method: "POST",
+      body: JSON.stringify({ input }),
+    },
+  );
+}
+```
+
+Note: Input wrapped in `{ input: ... }` to match `ResumeRunRequest` schema.
+
+### `cancelRun` implementation
+
+```typescript
+export async function cancelRun(runId: string): Promise<void> {
+  await request(`/runs/${encodeURIComponent(runId)}/cancel`, {
+    method: "POST",
+  });
+}
+```
+
+Server returns `{ detail: "Cancel requested" }` — we ignore the response body.
+
+### `getRunStatus` implementation
+
+```typescript
+export async function getRunStatus(
+  runId: string,
+): Promise<RunStatusResponse> {
+  return request<RunStatusResponse>(
+    `/runs/${encodeURIComponent(runId)}/status`,
+  );
+}
+```
+
+### `RunStatusResponse` type
+
+```typescript
+export interface RunStatusResponse {
+  run_id: string;
+  graph_id: string;
+  status: "running" | "paused" | "completed" | "error";
+  node_id: string | null;
+  prompt: string | null;
+  final_state: unknown | null;
+  duration_ms: number | null;
+  error: string | null;
+}
+```
+
+### Authentication for EventSource
+
+`EventSource` doesn't support custom headers. Auth works via the Vite proxy:
+
+- **Dev**: Vite proxy rewrites `/api` → `/v1` and forwards to `localhost:8000`.
+  The API key is injected by the proxy (or the execution server runs without
+  auth in dev mode).
+- **Production**: Same-origin reverse proxy handles the rewrite. No API key
+  in browser URLs.
+
+The existing Vite proxy config already covers `/api/*`, which includes
+`/api/runs/{id}/stream`. No proxy changes needed.
+
+## Tests
+
+### `packages/canvas/src/api/__tests__/runs.test.ts`
+
+Mock `fetch` via `vi.fn()` and `EventSource` via a lightweight mock.
+
+| Test | What it verifies |
+|------|-----------------|
+| `startRun sends correct URL and body shape` | URL is `/api/graphs/{encoded}/run`, body is `{ input: {} }` |
+| `startRun encodes graph ID with special chars` | `my graph#1` → `/api/graphs/my%20graph%231/run` |
+| `connectStream listens for all 7 event types` | `addEventListener` called for each type |
+| `connectStream passes eventId to handler` | `e.lastEventId` forwarded as number |
+| `connectStream handles JSON parse errors` | Malformed data doesn't crash, handler not called |
+| `connectStream cleanup closes EventSource` | `source.close()` called |
+| `resumeRun wraps input in request body` | Body is `{ input: <value> }` |
+| `cancelRun sends POST to correct URL` | URL is `/api/runs/{encoded}/cancel` |
+| `getRunStatus returns typed response` | Response shape matches `RunStatusResponse` |
+
+### EventSource mock strategy
+
+```typescript
+class MockEventSource {
+  listeners = new Map<string, Function>();
+  addEventListener(type: string, fn: Function) { this.listeners.set(type, fn); }
+  close = vi.fn();
+  // Simulate: mockSource.emit("node_started", { ... })
+  emit(type: string, data: unknown, id?: string) {
+    this.listeners.get(type)?.({ data: JSON.stringify(data), lastEventId: id });
+  }
+}
+vi.stubGlobal("EventSource", MockEventSource);
+```
+
+## Acceptance criteria
+
+- [ ] `startRun()` calls `/api/graphs/{encoded}/run` with body `{ input: ... }`
+- [ ] `connectStream()` receives typed events and calls `onEvent` with `GraphEvent` + `eventId`
+- [ ] `connectStream()` returns a cleanup function that closes the EventSource
+- [ ] `connectStream()` supports `lastEventId` query param for reconnection replay
+- [ ] `connectStream()` catches JSON parse errors without crashing
+- [ ] `resumeRun()` wraps input in `{ input: ... }` body
+- [ ] `cancelRun()` sends POST, ignores response body
+- [ ] `getRunStatus()` returns typed `RunStatusResponse`
+- [ ] All URLs use `encodeURIComponent()` on path params
+- [ ] All URLs use `/api` prefix (goes through Vite proxy)
+- [ ] No `onClose` in `StreamHandlers` (EventSource has no close event)
+- [ ] `apiUrl()` exported from `client.ts`, used by both `request()` and EventSource
+- [ ] `tsc --noEmit` passes
+- [ ] Unit tests pass
diff --git a/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.2-run-slice.md b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.2-run-slice.md
new file mode 100644
index 0000000..a6ca0a8
--- /dev/null
+++ b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.2-run-slice.md
@@ -0,0 +1,373 @@
+# Phase 2.2 — RunSlice Implementation
+
+## Goal
+
+Implement the full run lifecycle state machine in `runSlice.ts` — start a
+run, dispatch SSE events to state, highlight active node, handle completion
+and errors.
+
+## Depends on
+
+- 2.1 (SSE service layer)
+
+## Files to modify
+
+| File | Action |
+|------|--------|
+| `packages/canvas/src/store/runSlice.ts` | Rewrite stub |
+
+## State shape
+
+```typescript
+export type RunStatus =
+  | "idle"
+  | "running"
+  | "paused"
+  | "reconnecting"
+  | "completed"
+  | "error"
+  | "connection_lost";
+
+export interface RunSlice {
+  // State
+  activeRunId: string | null;
+  runStatus: RunStatus;
+  activeNodeId: string | null;
+  runOutput: GraphEvent[];
+  reconnectAttempts: number;
+  lastEventId: number;
+  finalState: unknown | null;
+  durationMs: number | null;
+  errorMessage: string | null;
+  pausedPrompt: string | null;
+
+  // Actions
+  startRun: (graphId: string, input?: Record<string, unknown>) => Promise<void>;
+  cancelRun: () => Promise<void>;
+  resumeRun: (input: unknown) => Promise<void>;
+  resetRun: () => void;
+
+  // Internal — called by SSE event handlers, not by components
+  _handleEvent: (event: GraphEvent, eventId: number | null) => void;
+  _handleStreamError: (error: Error) => void;
+  _disconnect: () => void;
+}
+```
+
+### Private state (module closure, not in Zustand)
+
+```typescript
+let cleanup: (() => void) | null = null;
+let terminalReceived = false;  // guards against onerror after graph_completed/error
+```
+
+The EventSource cleanup reference and terminal guard are held in the module
+closure, not in Zustand state, because they're not serializable and
+components don't need them.
+
+**Why `terminalReceived`?** When a terminal event (`graph_completed` or
+non-recoverable `error`) arrives, `_handleEvent` calls `cleanup()` which
+closes the EventSource. Closing an EventSource synchronously fires `onerror`.
+If `onerror` runs before `set()` commits the new status, `_handleStreamError`
+would see `runStatus === "running"` and trigger reconnection — even though
+the run is actually done. The flag prevents this race.
+
+## State machine
+
+```
+                    ┌──────────────┐
+                    │     idle     │
+                    └──────┬───────┘
+                           │ startRun()
+                    ┌──────▼───────┐
+              ┌─────│   running    │◄────────────────┐
+              │     └──┬───┬───┬───┘                  │
+              │        │   │   │                      │
+   connection │  graph_│   │   │ graph_    reconnect  │
+   error      │  paused│   │   │ completed  success   │
+              │        │   │   │                      │
+       ┌──────▼──┐  ┌──▼───┘  ┌▼──────────┐  ┌──────┴──────┐
+       │  error  │  │ paused│  │ completed  │  │reconnecting │
+       └─────────┘  └───────┘  └───────────┘  └─────────────┘
+              ▲                                       │
+              └───────── 3 failures ──────────────────┘
+```
+
+`cancelRun()` from `running` or `paused` → `idle`.
+`resetRun()` from any state → `idle`.
+
+## Event dispatch (`_handleEvent`)
+
+**Important**: `cleanup()` calls (which close the EventSource and may trigger
+`onerror`) must happen **outside** the `set()` callback to prevent re-entrant
+state updates.
+
+```typescript
+_handleEvent: (event, eventId) => {
+  // Close connection on terminal events BEFORE updating state.
+  // Set terminalReceived flag to prevent onerror → reconnection race.
+  if (event.event === "graph_completed" ||
+      (event.event === "error" && !event.data.recoverable)) {
+    terminalReceived = true;
+    cleanup?.();
+    cleanup = null;
+  }
+
+  set((s) => {
+    const output = [...s.runOutput, event];
+    const base = { runOutput: output, lastEventId: eventId ?? s.lastEventId };
+
+    switch (event.event) {
+      case "run_started":
+        return { ...base, runStatus: "running" };
+
+      case "node_started":
+        return { ...base, activeNodeId: event.data.node_id };
+
+      case "node_completed":
+        return base;
+        // activeNodeId stays until next node_started or completion
+
+      case "edge_traversed":
+        return base;
+
+      case "graph_paused":
+        return {
+          ...base,
+          runStatus: "paused",
+          activeNodeId: event.data.node_id,
+          pausedPrompt: event.data.prompt,
+        };
+
+      case "graph_completed":
+        return {
+          ...base,
+          runStatus: "completed",
+          activeNodeId: null,
+          finalState: event.data.final_state,
+          durationMs: event.data.duration_ms,
+        };
+
+      case "error":
+        if (!event.data.recoverable) {
+          return {
+            ...base,
+            runStatus: "error",
+            activeNodeId: event.data.node_id ?? s.activeNodeId,
+            errorMessage: event.data.message,
+          };
+        }
+        // Recoverable errors: log but don't change status
+        return base;
+
+      default:
+        return base;
+    }
+  });
+}
+```
+
+## `startRun` implementation
+
+```typescript
+startRun: async (graphId, input) => {
+  // Reset previous run state
+  cleanup?.();
+  cleanup = null;
+  terminalReceived = false;
+  set({
+    runStatus: "running",
+    activeRunId: null,
+    activeNodeId: null,
+    runOutput: [],
+    reconnectAttempts: 0,
+    lastEventId: 0,
+    finalState: null,
+    durationMs: null,
+    errorMessage: null,
+    pausedPrompt: null,
+  });
+
+  try {
+    // graphId is passed raw — encoding happens in the service layer
+    const { run_id } = await startRunApi(graphId, input);
+    set({ activeRunId: run_id });
+
+    const { _handleEvent, _handleStreamError } = useRunStore.getState();
+    cleanup = connectStream(run_id, {
+      onEvent: _handleEvent,
+      onError: _handleStreamError,
+    });
+  } catch (err) {
+    const message = err instanceof ApiError
+      ? err.message
+      : "Failed to start run";
+    set({ runStatus: "error", errorMessage: message });
+    useUIStore.getState().showToast(message, "error");
+  }
+}
+```
+
+Note: `graphId` is **not** encoded here. The `startRunApi()` function in the
+service layer handles encoding. This avoids double-encoding.
+
+## `cancelRun` implementation
+
+```typescript
+cancelRun: async () => {
+  const { activeRunId } = useRunStore.getState();
+  if (!activeRunId) return;
+
+  // Close connection first, then send cancel
+  cleanup?.();
+  cleanup = null;
+
+  try {
+    await cancelRunApi(activeRunId);
+  } catch {
+    // Best-effort — run may have already completed
+  }
+  set({ runStatus: "idle", activeNodeId: null });
+}
+```
+
+## `resumeRun` implementation (race-condition-safe)
+
+```typescript
+resumeRun: async (input) => {
+  const { activeRunId, _handleEvent, _handleStreamError } =
+    useRunStore.getState();
+  if (!activeRunId) return;
+
+  // 1. Close old connection
+  cleanup?.();
+  cleanup = null;
+
+  // 2. Open NEW SSE connection BEFORE the resume POST returns
+  //    (race condition fix per gw-frontend skill — server waits 2s for listener)
+  cleanup = connectStream(activeRunId, {
+    onEvent: _handleEvent,
+    onError: _handleStreamError,
+  });
+
+  set({ runStatus: "running", pausedPrompt: null });
+
+  // 3. Send resume request
+  try {
+    await resumeRunApi(activeRunId, input);
+  } catch (err) {
+    const message = err instanceof ApiError
+      ? err.message
+      : "Failed to resume run";
+    set({ runStatus: "error", errorMessage: message });
+    useUIStore.getState().showToast(message, "error");
+  }
+}
+```
+
+## `resetRun`
+
+```typescript
+resetRun: () => {
+  cleanup?.();
+  cleanup = null;
+  terminalReceived = false;
+  set({
+    activeRunId: null,
+    runStatus: "idle",
+    activeNodeId: null,
+    runOutput: [],
+    reconnectAttempts: 0,
+    lastEventId: 0,
+    finalState: null,
+    durationMs: null,
+    errorMessage: null,
+    pausedPrompt: null,
+  });
+}
+```
+
+## `_handleStreamError`
+
+Sets status to `connection_lost`. The full reconnection logic (backoff,
+status polling, reattach) is implemented in Part 2.5. This stub ensures
+Part 2.2 is functional standalone.
+
+```typescript
+_handleStreamError: (_error) => {
+  // Guard: skip if a terminal event was already received (onerror race)
+  if (terminalReceived) return;
+
+  cleanup = null;  // connection already closed by service layer
+  const { runStatus } = useRunStore.getState();
+  // Only react if we're in an active state
+  if (runStatus === "running" || runStatus === "reconnecting") {
+    set({ runStatus: "connection_lost" });
+  }
+}
+```
+
+## `_disconnect`
+
+Utility for reconnection logic in 2.5 to close the current connection.
+
+```typescript
+_disconnect: () => {
+  cleanup?.();
+  cleanup = null;
+}
+```
+
+## Tests
+
+### `packages/canvas/src/store/__tests__/runSlice.test.ts`
+
+Mock `startRunApi`, `connectStream`, `cancelRunApi`, `resumeRunApi` from `@api/runs`.
+
+| Test | What it verifies |
+|------|-----------------|
+| `idle → running on startRun` | Status transitions, `activeRunId` set |
+| `startRun error → error status + toast` | API failure sets `errorMessage`, shows toast |
+| `node_started sets activeNodeId` | `_handleEvent` with `node_started` |
+| `node_completed clears nothing` | `activeNodeId` stays until next `node_started` |
+| `graph_paused → paused status + prompt` | Status, `pausedPrompt` set |
+| `graph_completed → completed + cleanup` | Status, `finalState`, `durationMs`, cleanup called |
+| `non-recoverable error → error status + cleanup` | Status, `errorMessage`, cleanup called |
+| `recoverable error → status unchanged` | Only `runOutput` updated |
+| `cancelRun closes connection + sends cancel` | Cleanup called, API called, status → idle |
+| `resumeRun opens SSE before POST` | `connectStream` called before `resumeRunApi` |
+| `resetRun cleans up everything` | All state reset, cleanup called |
+| `cleanup() outside set() callback` | No re-entrant state updates on terminal events |
+| `lastEventId tracked from event handler` | Increments with each event |
+| `onerror after graph_completed does not change status` | `terminalReceived` guard prevents race |
+| `startRun resets terminalReceived flag` | Fresh run not blocked by previous terminal |
+
+### Mock strategy
+
+```typescript
+// Mock the API module
+vi.mock("@api/runs", () => ({
+  startRun: vi.fn(),
+  connectStream: vi.fn(() => vi.fn()),  // returns cleanup fn
+  cancelRun: vi.fn(),
+  resumeRun: vi.fn(),
+}));
+```
+
+## Acceptance criteria
+
+- [ ] `startRun` calls API, stores `run_id`, connects SSE stream
+- [ ] `graphId` passed raw to service layer (no double-encoding)
+- [ ] SSE events update `runOutput`, `activeNodeId`, `runStatus` correctly
+- [ ] `graph_completed` → status `completed`, stream closed **outside** `set()`
+- [ ] Non-recoverable `error` → status `error`, stream closed **outside** `set()`
+- [ ] `cancelRun` closes stream and sends cancel request
+- [ ] `resumeRun` opens new SSE connection before POST (race condition fix)
+- [ ] `resetRun` cleans up everything
+- [ ] `terminalReceived` flag prevents onerror → reconnection race after completion
+- [ ] `terminalReceived` reset in `startRun` and `resetRun`
+- [ ] EventSource cleanup ref held in module closure, not Zustand state
+- [ ] `useRunStore.getState()` used in callbacks to avoid stale closures
+- [ ] Errors shown via `showToast()`
+- [ ] `tsc --noEmit` passes
+- [ ] Unit tests pass
diff --git a/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.3-run-button-validation.md b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.3-run-button-validation.md
new file mode 100644
index 0000000..ec82f67
--- /dev/null
+++ b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.3-run-button-validation.md
@@ -0,0 +1,234 @@
+# Phase 2.3 — Run Button + Client-Side Validation
+
+## Goal
+
+Add a Run button to the canvas header that validates the graph before
+starting execution. Show validation errors as highlighted nodes + toast.
+
+## Depends on
+
+- 2.2 (RunSlice)
+
+## Files to create/modify
+
+| File | Action |
+|------|--------|
+| `packages/canvas/src/utils/validateGraph.ts` | Create |
+| `packages/canvas/src/components/canvas/CanvasHeader.tsx` | Add Run/Stop button |
+| `packages/canvas/src/components/canvas/RunInputDialog.tsx` | Create — simple input dialog |
+
+## Validation rules (Phase 2 subset)
+
+Only validate what Phase 2 nodes support (Start, LLM, End):
+
+```typescript
+interface ValidationError {
+  message: string;
+  nodeId?: string;  // for highlighting
+}
+
+export function validateGraph(
+  nodes: NodeSchema[],
+  edges: EdgeSchema[],
+): ValidationError[] {
+  const errors: ValidationError[] = [];
+
+  // 1. Exactly one Start node
+  const starts = nodes.filter(n => n.type === "start");
+  if (starts.length === 0) errors.push({ message: "Start node required" });
+  if (starts.length > 1) errors.push({ message: "Only one Start node allowed", nodeId: starts[1].id });
+
+  // 2. At least one End node
+  const ends = nodes.filter(n => n.type === "end");
+  if (ends.length === 0) errors.push({ message: "End node required" });
+
+  // 3. All nodes connected (no orphans)
+  const connectedIds = new Set(edges.flatMap(e => [e.source, e.target]));
+  for (const node of nodes) {
+    if (!connectedIds.has(node.id)) {
+      errors.push({ message: `${node.type} node is disconnected`, nodeId: node.id });
+    }
+  }
+
+  // 4. LLM nodes have a system prompt
+  for (const node of nodes) {
+    if (node.type === "llm" && !node.config.system_prompt?.trim()) {
+      errors.push({ message: "LLM node needs a system prompt", nodeId: node.id });
+    }
+  }
+
+  return errors;
+}
+```
+
+## Run button behavior
+
+The CanvasHeader gets a Run/Stop button on the right side:
+
+```
+[← Back]  Graph Name *  [Save]  [▶ Run] / [■ Stop]
+```
+
+**Important**: Read `nodes` and `edges` via `useGraphStore.getState()` inside
+the click handler — not as top-level selectors. `CanvasHeader` is memoized
+and subscribing to `nodes`/`edges` would re-render the header on every node
+drag.
+
+### States
+
+| `runStatus` | Button | Action |
+|-------------|--------|--------|
+| `idle` | `▶ Run` | Validate → open input dialog (or start directly) |
+| `running` | `■ Stop` | Call `cancelRun()` |
+| `paused` | `▶ Resume` | Open resume input (handled by run panel, Part 2.4) |
+| `reconnecting` | `■ Stop` (disabled spinner) | Wait for reconnection |
+| `completed` | `▶ Run` | Reset + start new run |
+| `error` | `▶ Run` | Reset + start new run |
+| `connection_lost` | `▶ Run` | Reset + start new run |
+
+### Validation flow
+
+1. User clicks Run
+2. `validateGraph(nodes, edges)` runs
+3. If errors:
+   - Show first error as toast (error variant)
+   - If error has `nodeId`, pulse that node red briefly (CSS class)
+   - Don't start run
+4. If valid:
+   - If graph has unsaved changes, auto-save first
+   - Open `RunInputDialog` (or skip if no input fields defined)
+
+## RunInputDialog
+
+Simple dialog for providing initial input to the run. Phase 2 keeps it
+minimal — a single JSON textarea.
+
+```typescript
+// RunInputDialog.tsx
+interface RunInputDialogProps {
+  open: boolean;
+  onClose: () => void;
+  onSubmit: (input: Record<string, unknown>) => void;
+}
+```
+
+Content:
+- Title: "Run Graph"
+- Textarea for JSON input (pre-filled with `{}`)
+- "Start" and "Cancel" buttons
+- JSON parse error shown inline if invalid
+
+Phase 4 replaces this with a schema-driven form based on `GraphSchema.state`
+fields. For now, raw JSON is sufficient.
+
+## Validation error highlighting
+
+Add a transient CSS class to nodes with validation errors:
+
+```typescript
+// In GraphCanvas or a new hook
+const [errorNodeIds, setErrorNodeIds] = useState<Set<string>>(new Set());
+
+// When validation fails:
+setErrorNodeIds(new Set(errors.filter(e => e.nodeId).map(e => e.nodeId!)));
+setTimeout(() => setErrorNodeIds(new Set()), 3000);  // clear after 3s
+```
+
+Node shell reads this to apply a red border pulse:
+```css
+.node-validation-error {
+  animation: error-pulse 0.6s ease-in-out 3;
+  border-color: var(--color-red-500);
+}
+```
+
+## Auto-save before run
+
+If the graph has unsaved changes (`dirty === true`), save before running.
+Check for save errors before proceeding.
+
+```typescript
+const handleRun = async () => {
+  const { nodes, edges, graph, dirty, saveGraph, saveError } =
+    useGraphStore.getState();
+  if (!graph) return;
+
+  const errors = validateGraph(nodes, edges);
+  if (errors.length > 0) { /* show errors */ return; }
+
+  if (dirty) {
+    await saveGraph();
+    if (useGraphStore.getState().saveError) {
+      showToast("Failed to save — fix save errors before running", "error");
+      return;
+    }
+  }
+
+  setInputDialogOpen(true);
+};
+```
+
+Note: `saveGraph()` catches errors internally and sets `saveError` without
+re-throwing. We check `saveError` after awaiting to detect failures.
+
+## RunInputDialog → startRun flow
+
+The `onSubmit` callback must close over `graph.id`:
+
+```typescript
+<RunInputDialog
+  open={inputDialogOpen}
+  onClose={() => setInputDialogOpen(false)}
+  onSubmit={(input) => {
+    setInputDialogOpen(false);
+    useRunStore.getState().startRun(graph!.id, input);
+  }}
+/>
+```
+
+`graph.id` comes from `useGraphStore(s => s.graph)` which CanvasHeader
+already subscribes to (for the name display). The `!` assertion is safe
+because the Run button is only enabled when `graph` is non-null.
+
+## Tests
+
+### `packages/canvas/src/utils/__tests__/validateGraph.test.ts`
+
+| Test | What it verifies |
+|------|-----------------|
+| `valid graph passes` | Start → LLM → End with system prompt returns [] |
+| `missing Start node` | Error with "Start node required" |
+| `missing End node` | Error with "End node required" |
+| `disconnected node` | Error with nodeId pointing to orphan |
+| `LLM without system prompt` | Error with nodeId pointing to LLM |
+| `multiple Start nodes` | Error on second Start node |
+
+### `packages/canvas/src/components/canvas/__tests__/CanvasHeader.test.tsx`
+
+Mock `useRunStore` and `useGraphStore`.
+
+| Test | What it verifies |
+|------|-----------------|
+| `shows Run button in idle` | Button text is "Run" |
+| `shows Stop button when running` | Button text is "Stop" |
+| `Run button triggers validation` | `validateGraph` called on click |
+| `auto-saves before run when dirty` | `saveGraph` called when `dirty === true` |
+
+### `packages/canvas/src/components/canvas/__tests__/RunInputDialog.test.tsx`
+
+| Test | What it verifies |
+|------|-----------------|
+| `renders JSON textarea` | Pre-filled with `{}` |
+| `rejects invalid JSON` | Error shown, submit disabled |
+| `calls onSubmit with parsed JSON` | Valid JSON parsed and passed |
+
+## Acceptance criteria
+
+- [ ] `validateGraph()` catches missing Start/End, orphan nodes, empty LLM prompts
+- [ ] Run button appears in CanvasHeader, changes label/action based on `runStatus`
+- [ ] Validation errors show as toast + node highlighting (3s auto-clear)
+- [ ] RunInputDialog opens for JSON input, validates JSON before submit
+- [ ] Graph auto-saves before run if dirty
+- [ ] Stop button calls `cancelRun()`
+- [ ] `tsc --noEmit` passes
+- [ ] Unit tests pass
diff --git a/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.4-run-panel.md b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.4-run-panel.md
new file mode 100644
index 0000000..5eea9f1
--- /dev/null
+++ b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.4-run-panel.md
@@ -0,0 +1,310 @@
+# Phase 2.4 — Run Panel + Node Highlighting
+
+## Goal
+
+Build the run output panel that shows real-time execution events, and
+highlight the active node on the canvas during a run.
+
+## Depends on
+
+- 2.2 (RunSlice)
+
+## Files to create/modify
+
+| File | Action |
+|------|--------|
+| `packages/canvas/src/components/panels/RunPanel.tsx` | Create |
+| `packages/canvas/src/components/panels/RunEventItem.tsx` | Create |
+| `packages/canvas/src/components/canvas/CanvasRoute.tsx` | Add RunPanel |
+| `packages/canvas/src/components/canvas/GraphCanvas.tsx` | Active node class |
+| `packages/canvas/src/components/canvas/nodes/BaseNodeShell.tsx` | Active node CSS |
+| `packages/canvas/src/components/ui/Sheet.tsx` | Add `"bottom"` side support |
+| `packages/canvas/src/styles/tokens.ts` | Add node-active animation tokens |
+
+## Run panel design
+
+The panel shows a live timeline of execution events. It opens automatically
+when a run starts and stays open until dismissed.
+
+### Layout
+
+Uses the existing `Sheet` component extended with `side: "bottom"`:
+
+```
+┌──────────────────────────────────────────────┐
+│  Canvas Header                    [▶ Run]    │
+├──────────────────────────────────────────────┤
+│                                              │
+│              React Flow Canvas               │
+│                                              │
+├──────────────────────────────────────────────┤
+│  Run Output                          [✕]     │
+│  ┌──────────────────────────────────────┐    │
+│  │ ▶ run_started         12:34:05       │    │
+│  │ ● node_started: llm_1  12:34:05      │    │
+│  │ ✓ node_completed: llm_1  1.2s        │    │
+│  │ → edge_traversed: llm_1 → end_1     │    │
+│  │ ✓ graph_completed       3.4s         │    │
+│  └──────────────────────────────────────┘    │
+└──────────────────────────────────────────────┘
+```
+
+### Panel positioning
+
+Read `useUIStore.panelLayout` to determine position:
+- `"bottom"` — panel slides up from bottom (default during runs)
+- `"right"` — panel slides in from right (shares space with config panel)
+
+For Phase 2, default to bottom. The toggle can be added later.
+
+### Sheet `"bottom"` support
+
+The current Sheet has `h-full w-80` hardcoded in the outer div's class
+string. Adding `"bottom"` requires pulling size classes into the
+`sideClasses` map so each side controls its own dimensions.
+
+Refactor the Sheet component:
+
+```typescript
+type SheetSide = "left" | "right" | "bottom";
+
+const sideClasses: Record<SheetSide, {
+  position: string; border: string;
+  openTransform: string; closedTransform: string;
+  size: string;
+}> = {
+  left: {
+    position: "left-0 top-0",
+    border: "border-r",
+    openTransform: "translate-x-0",
+    closedTransform: "-translate-x-full",
+    size: "h-full w-80",
+  },
+  right: {
+    position: "right-0 top-0",
+    border: "border-l",
+    openTransform: "translate-x-0",
+    closedTransform: "translate-x-full",
+    size: "h-full w-80",
+  },
+  bottom: {
+    position: "inset-x-0 bottom-0",
+    border: "border-t",
+    openTransform: "translate-y-0",     // ← must be Y-axis, not X
+    closedTransform: "translate-y-full",
+    size: "w-full h-64",
+  },
+};
+```
+
+The outer div template changes from:
+```
+`absolute ${position} top-0 z-20 h-full w-80 ${border} ... ${open ? "translate-x-0" : transform}`
+```
+to:
+```
+`absolute ${position} z-20 ${size} ${border} ... ${open ? openTransform : closedTransform}`
+```
+
+Key changes:
+- `top-0` moves into the left/right `position` entries (bottom uses `bottom-0`)
+- `h-full w-80` moves into `size` per variant
+- `openTransform` is split from `closedTransform` — bottom needs `translate-y-0`,
+  not `translate-x-0`
+```
+
+## RunPanel component
+
+```typescript
+interface RunPanelProps {
+  // No props — reads from useRunStore directly
+}
+
+export function RunPanel() {
+  const runStatus = useRunStore(s => s.runStatus);
+  const runOutput = useRunStore(s => s.runOutput);
+  const durationMs = useRunStore(s => s.durationMs);
+  const errorMessage = useRunStore(s => s.errorMessage);
+
+  // Don't render if no run has been started
+  if (runStatus === "idle") return null;
+
+  return (
+    <Sheet open={runStatus !== "idle"} onClose={handleClose} title={title} side="bottom">
+      <div className="flex flex-col gap-1 overflow-y-auto">
+        {runOutput.map((event, i) => (
+          <RunEventItem key={i} event={event} />
+        ))}
+        {runStatus === "completed" && (
+          <div>Completed in {formatDuration(durationMs)}</div>
+        )}
+        {runStatus === "error" && (
+          <div className="text-red-400">{errorMessage}</div>
+        )}
+        {runStatus === "connection_lost" && (
+          <div className="text-amber-400">Connection lost — reconnecting...</div>
+        )}
+      </div>
+    </Sheet>
+  );
+}
+```
+
+### Auto-scroll
+
+The event list auto-scrolls to the bottom as new events arrive:
+
+```typescript
+const endRef = useRef<HTMLDivElement>(null);
+useEffect(() => {
+  endRef.current?.scrollIntoView({ behavior: "smooth" });
+}, [runOutput.length]);
+```
+
+### Panel close behavior
+
+Closing the panel does NOT cancel the run. It just hides the panel. The run
+continues in the background (node highlighting still active). Re-open by
+clicking a "Show run" indicator in the header.
+
+## RunEventItem component
+
+Renders a single event row with icon, label, and timestamp/duration:
+
+```typescript
+function RunEventItem({ event }: { event: GraphEvent }) {
+  // Icon + color per event type:
+  // run_started    → ▶ blue
+  // node_started   → ● amber (spinning)
+  // node_completed → ✓ green + duration
+  // edge_traversed → → zinc-400
+  // graph_paused   → ⏸ amber + prompt text
+  // graph_completed → ✓✓ green + total duration
+  // error          → ✗ red + message
+}
+```
+
+Keep it simple — single line per event, monospace-friendly.
+
+## Active node highlighting
+
+When `activeNodeId` is set in the run store, the corresponding node on the
+canvas gets a pulsing border.
+
+### In BaseNodeShell
+
+`BaseNodeShell` does not currently accept an `id` prop. Use React Flow's
+`useNodeId()` hook instead of threading `id` through all node components:
+
+```typescript
+import { useNodeId } from "@xyflow/react";
+
+export function BaseNodeShell({ children, ... }: Props) {
+  const nodeId = useNodeId();  // provided by React Flow context
+  const activeNodeId = useRunStore(s => s.activeNodeId);
+  const isActive = activeNodeId === nodeId;
+
+  return (
+    <div className={cn(
+      "rounded-lg border ...",
+      isActive && "node-active",
+    )}>
+      {children}
+    </div>
+  );
+}
+```
+
+No changes needed to `StartNode`, `LLMNode`, or `EndNode` — `useNodeId()`
+reads from React Flow's internal context, which is already provided per-node.
+```
+
+### CSS animation (in tokens.ts or a CSS file)
+
+```css
+.node-active {
+  border-color: var(--color-blue-400);
+  box-shadow: 0 0 12px rgba(96, 165, 250, 0.4);
+  animation: node-pulse 1.5s ease-in-out infinite;
+}
+
+@keyframes node-pulse {
+  0%, 100% { box-shadow: 0 0 8px rgba(96, 165, 250, 0.3); }
+  50% { box-shadow: 0 0 16px rgba(96, 165, 250, 0.6); }
+}
+```
+
+### Completed/error node states
+
+After a run completes, briefly show completion state on nodes:
+- Nodes that completed successfully: green border flash (1s)
+- Node that errored: red border
+
+This is derived from `runOutput` — scan for `node_completed` and `error`
+events. Reset when `resetRun()` is called.
+
+## CanvasRoute integration
+
+```typescript
+// CanvasRoute.tsx
+<main className="relative h-[calc(100vh-3rem)]">
+  <GraphCanvas />
+  <NodeConfigPanel />
+  <RunPanel />
+</main>
+```
+
+The RunPanel renders conditionally (returns null when idle). Sheet handles
+the slide animation.
+
+## Canvas height adjustment
+
+When the bottom panel is open, the React Flow canvas needs to shrink to
+avoid overlap. Two approaches:
+
+1. **Overlay** — panel floats over canvas (simpler, may obscure nodes)
+2. **Resize** — canvas height adjusts when panel opens
+
+**Decision: Overlay for Phase 2.** The panel is 256px tall and semi-transparent
+at the top edge. Users can scroll/zoom the canvas. Phase 5 can add resize
+behavior if needed.
+
+## Tests
+
+### `packages/canvas/src/components/ui/__tests__/Sheet.test.tsx`
+
+| Test | What it verifies |
+|------|-----------------|
+| `renders full-width bottom variant` | Bottom sheet has `w-full h-64` classes |
+| `slide-up animation on bottom open` | `translate-y-0` when open, `translate-y-full` when closed |
+| `right variant still works after refactor` | `w-80 h-full` classes unchanged |
+
+### `packages/canvas/src/components/panels/__tests__/RunPanel.test.tsx`
+
+| Test | What it verifies |
+|------|-----------------|
+| `returns null when status is idle` | No DOM rendered |
+| `renders event timeline during run` | RunEventItem for each event in runOutput |
+| `shows completion duration` | Duration displayed when status is completed |
+| `shows error message` | Red error text when status is error |
+| `scrolls to bottom on new event` | `scrollIntoView` called on endRef |
+
+### `packages/canvas/src/components/panels/__tests__/RunEventItem.test.tsx`
+
+| Test | What it verifies |
+|------|-----------------|
+| `renders icon and label per event type` | Correct icon for each of 7 event types |
+
+## Acceptance criteria
+
+- [ ] Sheet `sideClasses` includes size (no hardcoded `w-80` in template)
+- [ ] Sheet supports `side="bottom"` with slide-up animation
+- [ ] RunPanel shows live event timeline during run
+- [ ] Events auto-scroll to bottom
+- [ ] Active node gets pulsing blue border during execution
+- [ ] Completed run shows total duration
+- [ ] Error state shows error message in red
+- [ ] Panel close hides panel but doesn't cancel run
+- [ ] RunPanel mounts in CanvasRoute alongside NodeConfigPanel
+- [ ] `tsc --noEmit` passes
+- [ ] Unit tests pass
diff --git a/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.5-reconnection-resume.md b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.5-reconnection-resume.md
new file mode 100644
index 0000000..3f4907e
--- /dev/null
+++ b/.claude/gw-plans/canvas/phase-2-sse-run-panel/phase-2.5-reconnection-resume.md
@@ -0,0 +1,264 @@
+# Phase 2.5 — Reconnection + Resume UI
+
+## Goal
+
+Implement the full SSE reconnection state machine with exponential backoff,
+and the human-in-the-loop resume form for paused runs.
+
+## Depends on
+
+- 2.1 (SSE service layer — `connectStream`, `getRunStatus`)
+- 2.4 (Run panel — where resume UI is rendered)
+
+## Files to create/modify
+
+| File | Action |
+|------|--------|
+| `packages/canvas/src/store/runSlice.ts` | Extend `_handleStreamError` with reconnection |
+| `packages/canvas/src/components/panels/ResumeForm.tsx` | Create |
+| `packages/canvas/src/components/panels/RunPanel.tsx` | Integrate ResumeForm + connection lost banner |
+
+## Reconnection state machine
+
+From gw-frontend skill — this is the authoritative spec:
+
+```
+CONNECTED → graph_completed → COMPLETED  (normal path)
+          ↘ connection drops unexpectedly
+            → RECONNECTING (backoff: 1s → 2s → 4s, max 3 attempts)
+            → GET /runs/{id}/status
+              { status: "completed" } → replay terminal event → COMPLETED
+              { status: "running"   } → reattach to /stream   → CONNECTED
+              { status: "paused"    } → show resume UI        → PAUSED
+              404 / server error      → FAILED, show banner
+            → 3 failed attempts → FAILED
+```
+
+### Concurrency guard
+
+Add a module-level flag to prevent parallel reconnection chains. If two
+`onerror` events fire in rapid succession, both `_handleStreamError` calls
+read `reconnectAttempts` at the same time and spawn duplicate chains.
+
+```typescript
+let reconnecting = false;  // module-level, alongside cleanup and terminalReceived
+```
+
+### Implementation in `_handleStreamError`
+
+Replace the Phase 2.2 stub with full reconnection:
+
+```typescript
+_handleStreamError: async (_error) => {
+  // Guard: skip if terminal event received (onerror race — see 2.2)
+  if (terminalReceived) return;
+
+  // Guard: prevent concurrent reconnection chains
+  if (reconnecting) return;
+
+  const state = useRunStore.getState();
+  if (state.runStatus === "completed" || state.runStatus === "error") return;
+  if (!state.activeRunId) return;
+
+  reconnecting = true;
+
+  const attempt = state.reconnectAttempts + 1;
+  if (attempt > 3) {
+    reconnecting = false;
+    set({
+      runStatus: "connection_lost",
+      errorMessage: "Connection lost after 3 attempts",
+    });
+    showToast("Connection lost — run may still be executing on the server", "error");
+    return;
+  }
+
+  set({ runStatus: "reconnecting", reconnectAttempts: attempt });
+
+  // Exponential backoff: 1s, 2s, 4s
+  await sleep(1000 * Math.pow(2, attempt - 1));
+
+  try {
+    const status = await getRunStatus(state.activeRunId);
+
+    switch (status.status) {
+      case "completed":
+        reconnecting = false;
+        set({
+          runStatus: "completed",
+          finalState: status.final_state,
+          durationMs: status.duration_ms,
+          activeNodeId: null,
+        });
+        break;
+
+      case "running": {
+        // Reattach SSE with last known event ID
+        const { _handleEvent, _handleStreamError, lastEventId } =
+          useRunStore.getState();
+        cleanup = connectStream(state.activeRunId, {
+          onEvent: _handleEvent,
+          onError: _handleStreamError,
+        }, lastEventId);
+        reconnecting = false;
+        set({ runStatus: "running", reconnectAttempts: 0 });
+        break;
+      }
+
+      case "paused":
+        reconnecting = false;
+        set({
+          runStatus: "paused",
+          activeNodeId: status.node_id,
+          pausedPrompt: status.prompt,
+        });
+        break;
+
+      case "error":
+        reconnecting = false;
+        set({
+          runStatus: "error",
+          errorMessage: status.error ?? "Run failed on server",
+          activeNodeId: null,
+        });
+        break;
+    }
+  } catch {
+    // Status check failed — retry (reset guard so recursive call proceeds)
+    reconnecting = false;
+    useRunStore.getState()._handleStreamError(new Error("Status check failed"));
+  }
+}
+```
+
+### `sleep` utility
+
+```typescript
+function sleep(ms: number): Promise<void> {
+  return new Promise(resolve => setTimeout(resolve, ms));
+}
+```
+
+### `lastEventId` tracking
+
+Already handled in Parts 2.1 and 2.2: `connectStream` passes `eventId` to
+`onEvent`, and `_handleEvent` stores it in `lastEventId`. On reconnection,
+`lastEventId` is passed to `connectStream` which adds it as
+`?last_event_id=N` — the server replays buffered events after that ID.
+
+## Resume UI
+
+When `runStatus === "paused"`, the run panel shows a resume form.
+
+### ResumeForm component
+
+```typescript
+interface ResumeFormProps {
+  prompt: string;        // from graph_paused event
+  onSubmit: (input: unknown) => void;
+}
+
+export function ResumeForm({ prompt, onSubmit }: ResumeFormProps) {
+  const [value, setValue] = useState("");
+
+  return (
+    <div className="border-t border-zinc-700 p-3">
+      <p className="text-sm text-zinc-300 mb-2">{prompt}</p>
+      <div className="flex gap-2">
+        <Input
+          value={value}
+          onChange={(e) => setValue(e.target.value)}
+          placeholder="Type your response..."
+          className="flex-1"
+        />
+        <Button onClick={() => onSubmit(value)} disabled={!value.trim()}>
+          Resume
+        </Button>
+      </div>
+    </div>
+  );
+}
+```
+
+### Integration in RunPanel
+
+```typescript
+// In RunPanel, after the event list:
+{runStatus === "paused" && pausedPrompt && (
+  <ResumeForm
+    prompt={pausedPrompt}
+    onSubmit={(input) => useRunStore.getState().resumeRun(input)}
+  />
+)}
+```
+
+### Resume flow (race condition safe)
+
+Already implemented in Phase 2.2's `resumeRun` — opens new SSE connection
+before the POST returns. The server has a 2-second timeout waiting for the
+SSE listener.
+
+Sequence:
+1. User types response, clicks Resume
+2. `resumeRun(input)` called
+3. Old SSE connection closed
+4. **New SSE connection opened immediately**
+5. `POST /runs/{id}/resume` sent
+6. Server detects SSE listener, feeds input to LangGraph
+7. Execution continues, events flow to new connection
+
+## Connection lost banner
+
+When `runStatus === "connection_lost"` (3 failed reconnection attempts), show
+a persistent banner in the run panel:
+
+```
+⚠ Connection lost — the run may still be executing on the server.
+[Retry Connection]  [Dismiss]
+```
+
+"Retry Connection" resets `reconnectAttempts` to 0 and triggers
+`_handleStreamError` again to restart the reconnection cycle.
+
+## Tests
+
+### `packages/canvas/src/store/__tests__/runSlice.reconnect.test.ts`
+
+Mock `getRunStatus`, `connectStream`, and `sleep` (via `vi.useFakeTimers`).
+
+| Test | What it verifies |
+|------|-----------------|
+| `reconnects with exponential backoff` | Delays are 1s, 2s, 4s |
+| `recovers on status=running` | Opens new SSE, resets attempts, status → running |
+| `recovers on status=completed` | Sets finalState/durationMs, status → completed |
+| `recovers on status=paused` | Sets pausedPrompt, status → paused |
+| `recovers on status=error` | Sets errorMessage, status → error |
+| `gives up after 3 attempts` | Status → connection_lost, toast shown |
+| `status check failure triggers retry` | Recursive call to _handleStreamError |
+| `lastEventId passed to connectStream on reattach` | connectStream called with stored lastEventId |
+| `concurrent onerror during reconnection is ignored` | Second call returns immediately via `reconnecting` guard |
+| `reconnecting flag resets on success` | Flag is false after status=running recovery |
+| `reconnecting flag resets on give-up` | Flag is false after 3 failed attempts |
+
+### `packages/canvas/src/components/panels/__tests__/ResumeForm.test.tsx`
+
+| Test | What it verifies |
+|------|-----------------|
+| `renders prompt text` | Prompt from graph_paused shown |
+| `submit button disabled when empty` | Can't submit empty input |
+| `calls onSubmit with input value` | Submit fires with typed value |
+
+## Acceptance criteria
+
+- [ ] `reconnecting` guard prevents concurrent reconnection chains
+- [ ] `reconnecting` reset on success, give-up, and retry
+- [ ] Reconnection attempts with exponential backoff (1s → 2s → 4s)
+- [ ] Status check determines correct recovery path (completed/running/paused/error)
+- [ ] Successful reconnection resets attempt counter
+- [ ] 3 failed attempts → `connection_lost` status + banner
+- [ ] `lastEventId` tracked and passed to `connectStream` on reconnect
+- [ ] Server replays buffered events after the last seen ID
+- [ ] ResumeForm shows prompt and input field when paused
+- [ ] Resume opens new SSE before POST (race condition safe)
+- [ ] Connection lost banner with manual retry option
+- [ ] `tsc --noEmit` passes

From 899643b5a1277a806b0e39c43080aa4e80bc4bab Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 17:39:47 -0700
Subject: [PATCH 2/9] =?UTF-8?q?feat(canvas):=20implement=20Phase=202=20?=
 =?UTF-8?q?=E2=80=94=20SSE=20run=20panel?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Phase 2.1: SSE service layer
- Export apiUrl() from client.ts for shared URL construction
- Rewrite runs.ts: startRun, resumeRun, cancelRun, getRunStatus,
  connectStream with typed SSE events and Last-Event-ID support
- All request bodies wrap input in { input: ... } per server schema

Phase 2.2: RunSlice state machine
- Full event dispatch for all 7 GraphEvent types
- terminalReceived flag prevents onerror race after graph_completed
- Module-closure cleanup ref (not in Zustand state)

Phase 2.3: Run button + validation
- Run/Stop button in CanvasHeader with status-driven states
- validateGraph checks Start/End presence, orphans, LLM prompts
- Auto-save before run with error checking
- RunInputDialog for JSON input

Phase 2.4: Run panel + node highlighting
- Sheet extended with side="bottom" (openTransform/closedTransform)
- RunPanel with event timeline, auto-scroll, status banners
- Active node pulse via useNodeId() + useRunStore in BaseNodeShell

Phase 2.5: Reconnection + resume
- Exponential backoff (1s→2s→4s, max 3 attempts)
- Status polling fallback (completed/running/paused/error)
- reconnecting concurrency guard prevents parallel chains
- ResumeForm for human-in-the-loop paused runs
- Fix stale URL in gw-frontend skill

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 .claude/skills/gw-frontend/SKILL.md           |   4 +-
 .../canvas/src/api/__tests__/runs.test.ts     | 216 ++++++++++
 packages/canvas/src/api/client.ts             |   7 +-
 packages/canvas/src/api/runs.ts               | 130 +++++-
 .../src/components/canvas/CanvasHeader.tsx    |  90 ++++-
 .../src/components/canvas/CanvasRoute.tsx     |   2 +
 .../src/components/canvas/RunInputDialog.tsx  |  56 +++
 .../components/canvas/nodes/BaseNodeShell.tsx |   9 +-
 .../nodes/__tests__/BaseNodeShell.test.tsx    |   9 +
 .../canvas/nodes/__tests__/EndNode.test.tsx   |   9 +
 .../canvas/nodes/__tests__/LLMNode.test.tsx   |   9 +
 .../canvas/nodes/__tests__/StartNode.test.tsx |   9 +
 .../src/components/panels/ResumeForm.tsx      |  33 ++
 .../src/components/panels/RunEventItem.tsx    | 104 +++++
 .../canvas/src/components/panels/RunPanel.tsx |  83 ++++
 packages/canvas/src/components/ui/Sheet.tsx   |  34 +-
 .../src/store/__tests__/runSlice.test.ts      | 377 ++++++++++++++++++
 packages/canvas/src/store/runSlice.ts         | 302 +++++++++++++-
 .../src/utils/__tests__/validateGraph.test.ts | 116 ++++++
 packages/canvas/src/utils/validateGraph.ts    |  67 ++++
 20 files changed, 1616 insertions(+), 50 deletions(-)
 create mode 100644 packages/canvas/src/api/__tests__/runs.test.ts
 create mode 100644 packages/canvas/src/components/canvas/RunInputDialog.tsx
 create mode 100644 packages/canvas/src/components/panels/ResumeForm.tsx
 create mode 100644 packages/canvas/src/components/panels/RunEventItem.tsx
 create mode 100644 packages/canvas/src/components/panels/RunPanel.tsx
 create mode 100644 packages/canvas/src/store/__tests__/runSlice.test.ts
 create mode 100644 packages/canvas/src/utils/__tests__/validateGraph.test.ts
 create mode 100644 packages/canvas/src/utils/validateGraph.ts

diff --git a/.claude/skills/gw-frontend/SKILL.md b/.claude/skills/gw-frontend/SKILL.md
index 3895972..da0b63d 100644
--- a/.claude/skills/gw-frontend/SKILL.md
+++ b/.claude/skills/gw-frontend/SKILL.md
@@ -121,9 +121,9 @@ interface UISlice {
 CONNECTED → graph_completed → COMPLETED  (normal path)
           ↘ connection drops unexpectedly
             → RECONNECTING (backoff: 1s → 2s → 4s, max 3 attempts)
-            → GET /graphs/run/:id/status
+            → GET /runs/:id/status
               { status: "completed" } → replay terminal event → COMPLETED
-              { status: "running"   } → reattach to /stream   → CONNECTED
+              { status: "running"   } → reattach to /runs/:id/stream → CONNECTED
               { status: "paused"    } → show resume UI        → PAUSED
               404 / server error      → FAILED, show banner
             → 3 failed attempts → FAILED
diff --git a/packages/canvas/src/api/__tests__/runs.test.ts b/packages/canvas/src/api/__tests__/runs.test.ts
new file mode 100644
index 0000000..5d6166b
--- /dev/null
+++ b/packages/canvas/src/api/__tests__/runs.test.ts
@@ -0,0 +1,216 @@
+import {
+  cancelRun,
+  connectStream,
+  getRunStatus,
+  resumeRun,
+  startRun,
+} from "../runs";
+
+// ---------------------------------------------------------------------------
+// Mocks
+// ---------------------------------------------------------------------------
+
+vi.mock("../client", () => ({
+  apiUrl: (path: string) => `/api${path}`,
+  request: vi.fn(),
+}));
+
+const { request } = await import("../client");
+
+class MockEventSource {
+  url: string;
+  listeners = new Map<string, ((e: MessageEvent) => void)[]>();
+  onerror: ((e: Event) => void) | null = null;
+  close = vi.fn();
+
+  constructor(url: string) {
+    this.url = url;
+    mockEventSourceInstances.push(this);
+  }
+
+  addEventListener(type: string, fn: (e: MessageEvent) => void) {
+    const existing = this.listeners.get(type) ?? [];
+    existing.push(fn);
+    this.listeners.set(type, existing);
+  }
+
+  emit(type: string, data: unknown, id?: string) {
+    const fns = this.listeners.get(type);
+    if (!fns) return;
+    for (const fn of fns) {
+      fn({ data: JSON.stringify(data), lastEventId: id ?? "" } as MessageEvent);
+    }
+  }
+}
+
+let mockEventSourceInstances: MockEventSource[] = [];
+vi.stubGlobal("EventSource", MockEventSource);
+
+function latestSource(): MockEventSource {
+  const s = mockEventSourceInstances[mockEventSourceInstances.length - 1];
+  if (!s) throw new Error("No EventSource created");
+  return s;
+}
+
+function lastRequestBody(): unknown {
+  const calls = vi.mocked(request).mock.calls;
+  const call = calls[calls.length - 1];
+  if (!call) throw new Error("No request calls");
+  const opts = call[1] as RequestInit | undefined;
+  return JSON.parse(opts?.body as string);
+}
+
+function lastRequestPath(): string {
+  const calls = vi.mocked(request).mock.calls;
+  const call = calls[calls.length - 1];
+  if (!call) throw new Error("No request calls");
+  return call[0] as string;
+}
+
+beforeEach(() => {
+  vi.clearAllMocks();
+  mockEventSourceInstances = [];
+});
+
+// ---------------------------------------------------------------------------
+// REST endpoints
+// ---------------------------------------------------------------------------
+
+describe("startRun", () => {
+  it("calls correct URL with encoded graph ID", async () => {
+    vi.mocked(request).mockResolvedValue({ run_id: "r1", status: "running" });
+    await startRun("my graph#1", { key: "val" });
+    expect(request).toHaveBeenCalledWith(
+      "/graphs/my%20graph%231/run",
+      expect.objectContaining({ method: "POST" }),
+    );
+  });
+
+  it("wraps input in { input } body", async () => {
+    vi.mocked(request).mockResolvedValue({ run_id: "r1", status: "running" });
+    await startRun("g1", { foo: "bar" });
+    expect(lastRequestBody()).toEqual({ input: { foo: "bar" } });
+  });
+
+  it("defaults input to empty object", async () => {
+    vi.mocked(request).mockResolvedValue({ run_id: "r1", status: "running" });
+    await startRun("g1");
+    expect(lastRequestBody()).toEqual({ input: {} });
+  });
+});
+
+describe("resumeRun", () => {
+  it("wraps input in { input } body", async () => {
+    vi.mocked(request).mockResolvedValue({ status: "resumed" });
+    await resumeRun("r1", "user response");
+    expect(lastRequestPath()).toBe("/runs/r1/resume");
+    expect(lastRequestBody()).toEqual({ input: "user response" });
+  });
+});
+
+describe("cancelRun", () => {
+  it("sends POST to correct URL", async () => {
+    vi.mocked(request).mockResolvedValue(undefined);
+    await cancelRun("r1");
+    expect(request).toHaveBeenCalledWith(
+      "/runs/r1/cancel",
+      expect.objectContaining({ method: "POST" }),
+    );
+  });
+});
+
+describe("getRunStatus", () => {
+  it("calls correct URL and returns response", async () => {
+    const status = { run_id: "r1", status: "running" };
+    vi.mocked(request).mockResolvedValue(status);
+    const result = await getRunStatus("r1");
+    expect(request).toHaveBeenCalledWith("/runs/r1/status");
+    expect(result).toEqual(status);
+  });
+});
+
+// ---------------------------------------------------------------------------
+// SSE stream
+// ---------------------------------------------------------------------------
+
+describe("connectStream", () => {
+  it("creates EventSource with correct URL through apiUrl", () => {
+    connectStream("r1", { onEvent: vi.fn(), onError: vi.fn() });
+    expect(latestSource().url).toBe("/api/runs/r1/stream");
+  });
+
+  it("encodes run ID in URL", () => {
+    connectStream("run #1", { onEvent: vi.fn(), onError: vi.fn() });
+    expect(latestSource().url).toBe("/api/runs/run%20%231/stream");
+  });
+
+  it("adds last_event_id query param when > 0", () => {
+    connectStream("r1", { onEvent: vi.fn(), onError: vi.fn() }, 5);
+    expect(latestSource().url).toBe("/api/runs/r1/stream?last_event_id=5");
+  });
+
+  it("omits query param when lastEventId is 0", () => {
+    connectStream("r1", { onEvent: vi.fn(), onError: vi.fn() }, 0);
+    expect(latestSource().url).toBe("/api/runs/r1/stream");
+  });
+
+  it("listens for all 7 event types", () => {
+    connectStream("r1", { onEvent: vi.fn(), onError: vi.fn() });
+    const types = [...latestSource().listeners.keys()];
+    expect(types).toEqual([
+      "run_started",
+      "node_started",
+      "node_completed",
+      "edge_traversed",
+      "graph_paused",
+      "graph_completed",
+      "error",
+    ]);
+  });
+
+  it("passes parsed event and eventId to onEvent", () => {
+    const onEvent = vi.fn();
+    connectStream("r1", { onEvent, onError: vi.fn() });
+    latestSource().emit("node_started", { node_id: "n1", timestamp: "t" }, "3");
+    expect(onEvent).toHaveBeenCalledWith(
+      { event: "node_started", data: { node_id: "n1", timestamp: "t" } },
+      3,
+    );
+  });
+
+  it("passes null eventId when lastEventId is empty", () => {
+    const onEvent = vi.fn();
+    connectStream("r1", { onEvent, onError: vi.fn() });
+    latestSource().emit("run_started", { run_id: "r1", timestamp: "t" });
+    expect(onEvent).toHaveBeenCalledWith(expect.anything(), null);
+  });
+
+  it("handles JSON parse errors without crashing", () => {
+    const onEvent = vi.fn();
+    connectStream("r1", { onEvent, onError: vi.fn() });
+    const fns = latestSource().listeners.get("node_started") ?? [];
+    const handler = fns[0];
+    if (!handler) throw new Error("Expected listener");
+    handler({ data: "not json", lastEventId: "" } as MessageEvent);
+    expect(onEvent).not.toHaveBeenCalled();
+  });
+
+  it("calls onError and closes source on onerror", () => {
+    const onError = vi.fn();
+    connectStream("r1", { onEvent: vi.fn(), onError });
+    const source = latestSource();
+    source.onerror?.(new Event("error"));
+    expect(source.close).toHaveBeenCalled();
+    expect(onError).toHaveBeenCalledWith(expect.any(Error));
+  });
+
+  it("cleanup function closes EventSource", () => {
+    const cleanup = connectStream("r1", {
+      onEvent: vi.fn(),
+      onError: vi.fn(),
+    });
+    const source = latestSource();
+    cleanup();
+    expect(source.close).toHaveBeenCalled();
+  });
+});
diff --git a/packages/canvas/src/api/client.ts b/packages/canvas/src/api/client.ts
index 84bdc95..92209f7 100644
--- a/packages/canvas/src/api/client.ts
+++ b/packages/canvas/src/api/client.ts
@@ -30,6 +30,11 @@ export class ApiError extends Error {
 
 const BASE_URL = "/api";
 
+/** Build a full API URL from a path. Used by both request() and EventSource. */
+export function apiUrl(path: string): string {
+  return `${BASE_URL}${path}`;
+}
+
 export async function request<T>(
   path: string,
   options?: RequestInit,
@@ -38,7 +43,7 @@ export async function request<T>(
     "Content-Type": "application/json",
   };
 
-  const response = await fetch(`${BASE_URL}${path}`, {
+  const response = await fetch(apiUrl(path), {
     ...options,
     headers: { ...headers, ...options?.headers },
   });
diff --git a/packages/canvas/src/api/runs.ts b/packages/canvas/src/api/runs.ts
index f017e25..107517e 100644
--- a/packages/canvas/src/api/runs.ts
+++ b/packages/canvas/src/api/runs.ts
@@ -1,29 +1,129 @@
 /** Run management and SSE streaming service layer. */
 
-import { request } from "./client";
+import type { GraphEvent } from "@shared/events";
+import { apiUrl, request } from "./client";
 
+// ---------------------------------------------------------------------------
+// Types
+// ---------------------------------------------------------------------------
+
+export interface StreamHandlers {
+  onEvent: (event: GraphEvent, eventId: number | null) => void;
+  onError: (error: Error) => void;
+}
+
+export interface RunStatusResponse {
+  run_id: string;
+  graph_id: string;
+  status: "running" | "paused" | "completed" | "error";
+  node_id: string | null;
+  prompt: string | null;
+  final_state: unknown | null;
+  duration_ms: number | null;
+  error: string | null;
+}
+
+// ---------------------------------------------------------------------------
+// REST endpoints
+// ---------------------------------------------------------------------------
+
+/** Start a run — POST /graphs/{graph_id}/run */
 export async function startRun(
   graphId: string,
+  input?: Record<string, unknown>,
+): Promise<{ run_id: string; status: string }> {
+  return request<{ run_id: string; status: string }>(
+    `/graphs/${encodeURIComponent(graphId)}/run`,
+    {
+      method: "POST",
+      body: JSON.stringify({ input: input ?? {} }),
+    },
+  );
+}
+
+/** Resume a paused run — POST /runs/{run_id}/resume */
+export async function resumeRun(
+  runId: string,
   input: unknown,
-): Promise<{ run_id: string }> {
-  return request<{ run_id: string }>(`/graphs/${graphId}/run`, {
+): Promise<{ status: string }> {
+  return request<{ status: string }>(
+    `/runs/${encodeURIComponent(runId)}/resume`,
+    {
+      method: "POST",
+      body: JSON.stringify({ input }),
+    },
+  );
+}
+
+/** Cancel a running/paused run — POST /runs/{run_id}/cancel */
+export async function cancelRun(runId: string): Promise<void> {
+  await request(`/runs/${encodeURIComponent(runId)}/cancel`, {
     method: "POST",
-    body: JSON.stringify(input),
   });
 }
 
+/** Get current run status — GET /runs/{run_id}/status */
+export async function getRunStatus(runId: string): Promise<RunStatusResponse> {
+  return request<RunStatusResponse>(
+    `/runs/${encodeURIComponent(runId)}/status`,
+  );
+}
+
+// ---------------------------------------------------------------------------
+// SSE stream
+// ---------------------------------------------------------------------------
+
+const EVENT_TYPES = [
+  "run_started",
+  "node_started",
+  "node_completed",
+  "edge_traversed",
+  "graph_paused",
+  "graph_completed",
+  "error",
+] as const;
+
+/**
+ * Connect to an SSE run stream.
+ *
+ * Uses named event listeners (not onmessage) because the server sends typed
+ * SSE events. Returns a cleanup function that closes the EventSource.
+ *
+ * No auto-reconnect — EventSource is closed on error so the store's
+ * reconnection state machine (runSlice) can control backoff and status checks.
+ */
 export function connectStream(
   runId: string,
-  handlers: {
-    onMessage: (event: string, data: unknown) => void;
-    onError: (error: Event) => void;
-  },
-): EventSource {
-  const source = new EventSource(`/api/graphs/run/${runId}/stream`);
-  source.onmessage = (e) => {
-    const parsed = JSON.parse(e.data);
-    handlers.onMessage(parsed.event, parsed.data);
+  handlers: StreamHandlers,
+  lastEventId?: number,
+): () => void {
+  const encoded = encodeURIComponent(runId);
+  const params =
+    lastEventId != null && lastEventId > 0
+      ? `?last_event_id=${lastEventId}`
+      : "";
+  const url = apiUrl(`/runs/${encoded}/stream${params}`);
+
+  const source = new EventSource(url);
+
+  for (const type of EVENT_TYPES) {
+    source.addEventListener(type, (e: MessageEvent) => {
+      const eventId = e.lastEventId ? Number(e.lastEventId) : null;
+      try {
+        const data = JSON.parse(e.data);
+        handlers.onEvent({ event: type, data } as GraphEvent, eventId);
+      } catch {
+        // Malformed SSE data — skip event, don't crash the stream
+      }
+    });
+  }
+
+  source.onerror = () => {
+    source.close();
+    handlers.onError(new Error("SSE connection lost"));
+  };
+
+  return () => {
+    source.close();
   };
-  source.onerror = handlers.onError;
-  return source;
 }
diff --git a/packages/canvas/src/components/canvas/CanvasHeader.tsx b/packages/canvas/src/components/canvas/CanvasHeader.tsx
index b57cf03..8d4224a 100644
--- a/packages/canvas/src/components/canvas/CanvasHeader.tsx
+++ b/packages/canvas/src/components/canvas/CanvasHeader.tsx
@@ -1,7 +1,8 @@
 import { useGraphStore } from "@store/graphSlice";
+import { useRunStore } from "@store/runSlice";
 import { useUIStore } from "@store/uiSlice";
 import { Button } from "@ui/Button";
-import { ChevronLeft, Pencil, Save } from "lucide-react";
+import { ChevronLeft, Pencil, Play, Save, Square } from "lucide-react";
 import {
   type KeyboardEvent,
   memo,
@@ -11,6 +12,8 @@ import {
   useState,
 } from "react";
 import { useNavigate } from "react-router";
+import { validateGraph } from "../../utils/validateGraph";
+import { RunInputDialog } from "./RunInputDialog";
 
 function CanvasHeaderComponent() {
   const graph = useGraphStore((s) => s.graph);
@@ -19,9 +22,11 @@ function CanvasHeaderComponent() {
   const saveError = useGraphStore((s) => s.saveError);
   const saveGraph = useGraphStore((s) => s.saveGraph);
   const renameGraph = useGraphStore((s) => s.renameGraph);
+  const runStatus = useRunStore((s) => s.runStatus);
   const navigate = useNavigate();
 
   const [editing, setEditing] = useState(false);
+  const [inputDialogOpen, setInputDialogOpen] = useState(false);
   const inputRef = useRef<HTMLInputElement>(null);
 
   // Show toast when saveError appears
@@ -68,6 +73,49 @@ function CanvasHeaderComponent() {
     saveGraph();
   }, [saveGraph]);
 
+  const handleRun = useCallback(async () => {
+    const { nodes, edges, dirty: isDirty } = useGraphStore.getState();
+
+    const errors = validateGraph(nodes, edges);
+    if (errors.length > 0) {
+      useUIStore
+        .getState()
+        .showToast(errors[0]?.message ?? "Validation failed", "error");
+      return;
+    }
+
+    if (isDirty) {
+      await useGraphStore.getState().saveGraph();
+      if (useGraphStore.getState().saveError) {
+        useUIStore
+          .getState()
+          .showToast(
+            "Failed to save — fix save errors before running",
+            "error",
+          );
+        return;
+      }
+    }
+
+    setInputDialogOpen(true);
+  }, []);
+
+  const handleRunSubmit = useCallback(
+    (input: Record<string, unknown>) => {
+      setInputDialogOpen(false);
+      if (graph) {
+        useRunStore.getState().startRun(graph.id, input);
+      }
+    },
+    [graph],
+  );
+
+  const handleStop = useCallback(() => {
+    useRunStore.getState().cancelRun();
+  }, []);
+
+  const isRunning = runStatus === "running" || runStatus === "reconnecting";
+
   return (
     <>
       <header className="flex h-12 items-center justify-between border-b border-zinc-800 px-4">
@@ -117,15 +165,39 @@ function CanvasHeaderComponent() {
           )}
         </div>
 
-        <Button
-          variant="primary"
-          onClick={handleSave}
-          disabled={!graph || !dirty || saving}
-        >
-          <Save size={14} className="mr-1" />
-          {saving ? "Saving..." : "Save"}
-        </Button>
+        <div className="flex items-center gap-2">
+          <Button
+            variant="primary"
+            onClick={handleSave}
+            disabled={!graph || !dirty || saving}
+          >
+            <Save size={14} className="mr-1" />
+            {saving ? "Saving..." : "Save"}
+          </Button>
+
+          {isRunning ? (
+            <Button variant="ghost" onClick={handleStop}>
+              <Square size={14} className="mr-1 text-red-400" />
+              Stop
+            </Button>
+          ) : (
+            <Button
+              variant="primary"
+              onClick={handleRun}
+              disabled={!graph || saving}
+            >
+              <Play size={14} className="mr-1" />
+              Run
+            </Button>
+          )}
+        </div>
       </header>
+
+      <RunInputDialog
+        open={inputDialogOpen}
+        onClose={() => setInputDialogOpen(false)}
+        onSubmit={handleRunSubmit}
+      />
     </>
   );
 }
diff --git a/packages/canvas/src/components/canvas/CanvasRoute.tsx b/packages/canvas/src/components/canvas/CanvasRoute.tsx
index 8979332..c38322e 100644
--- a/packages/canvas/src/components/canvas/CanvasRoute.tsx
+++ b/packages/canvas/src/components/canvas/CanvasRoute.tsx
@@ -6,6 +6,7 @@ import { useEffect, useState } from "react";
 import { Link, useParams } from "react-router";
 import { useBeforeUnload } from "../../hooks/useBeforeUnload";
 import { NodeConfigPanel } from "../panels/NodeConfigPanel";
+import { RunPanel } from "../panels/RunPanel";
 import { CanvasHeader } from "./CanvasHeader";
 import { GraphCanvas } from "./GraphCanvas";
 
@@ -57,6 +58,7 @@ export function CanvasRoute() {
           <main className="relative h-[calc(100vh-3rem)]">
             <GraphCanvas />
             <NodeConfigPanel />
+            <RunPanel />
           </main>
         </div>
       </CanvasProvider>
diff --git a/packages/canvas/src/components/canvas/RunInputDialog.tsx b/packages/canvas/src/components/canvas/RunInputDialog.tsx
new file mode 100644
index 0000000..081a519
--- /dev/null
+++ b/packages/canvas/src/components/canvas/RunInputDialog.tsx
@@ -0,0 +1,56 @@
+import { Button } from "@ui/Button";
+import { Dialog } from "@ui/Dialog";
+import { useState } from "react";
+
+interface RunInputDialogProps {
+  open: boolean;
+  onClose: () => void;
+  onSubmit: (input: Record<string, unknown>) => void;
+}
+
+export function RunInputDialog({
+  open,
+  onClose,
+  onSubmit,
+}: RunInputDialogProps) {
+  const [value, setValue] = useState("{}");
+  const [parseError, setParseError] = useState<string | null>(null);
+
+  const handleSubmit = () => {
+    try {
+      const parsed = JSON.parse(value);
+      setParseError(null);
+      onSubmit(parsed as Record<string, unknown>);
+    } catch {
+      setParseError("Invalid JSON");
+    }
+  };
+
+  return (
+    <Dialog open={open} onClose={onClose} title="Run Graph">
+      <div className="flex flex-col gap-3">
+        <label className="text-sm text-zinc-400">
+          Initial input (JSON)
+          <textarea
+            value={value}
+            onChange={(e) => {
+              setValue(e.target.value);
+              setParseError(null);
+            }}
+            className="mt-1 block w-full rounded border border-zinc-700 bg-zinc-800 px-3 py-2 font-mono text-sm text-zinc-100 outline-none focus:border-indigo-500"
+            rows={4}
+          />
+        </label>
+        {parseError && <p className="text-sm text-red-400">{parseError}</p>}
+        <div className="flex justify-end gap-2">
+          <Button variant="ghost" onClick={onClose}>
+            Cancel
+          </Button>
+          <Button variant="primary" onClick={handleSubmit}>
+            Start
+          </Button>
+        </div>
+      </div>
+    </Dialog>
+  );
+}
diff --git a/packages/canvas/src/components/canvas/nodes/BaseNodeShell.tsx b/packages/canvas/src/components/canvas/nodes/BaseNodeShell.tsx
index 454b004..c0be2c7 100644
--- a/packages/canvas/src/components/canvas/nodes/BaseNodeShell.tsx
+++ b/packages/canvas/src/components/canvas/nodes/BaseNodeShell.tsx
@@ -1,4 +1,5 @@
-import { Handle, Position } from "@xyflow/react";
+import { useRunStore } from "@store/runSlice";
+import { Handle, Position, useNodeId } from "@xyflow/react";
 import type { LucideIcon } from "lucide-react";
 import { type ReactNode, memo } from "react";
 
@@ -23,9 +24,13 @@ function BaseNodeShellComponent({
   targetHandle = true,
   children,
 }: BaseNodeShellProps) {
+  const nodeId = useNodeId();
+  const activeNodeId = useRunStore((s) => s.activeNodeId);
+  const isActive = nodeId != null && activeNodeId === nodeId;
+
   return (
     <div
-      className={`gw-node ${accentClass} ${selected ? "gw-node-selected" : ""}`}
+      className={`gw-node ${accentClass} ${selected ? "gw-node-selected" : ""} ${isActive ? "gw-node-active" : ""}`}
     >
       {targetHandle && (
         <Handle type="target" position={Position.Left} className="gw-handle" />
diff --git a/packages/canvas/src/components/canvas/nodes/__tests__/BaseNodeShell.test.tsx b/packages/canvas/src/components/canvas/nodes/__tests__/BaseNodeShell.test.tsx
index 989c2a1..4a7b76f 100644
--- a/packages/canvas/src/components/canvas/nodes/__tests__/BaseNodeShell.test.tsx
+++ b/packages/canvas/src/components/canvas/nodes/__tests__/BaseNodeShell.test.tsx
@@ -10,6 +10,15 @@ vi.mock("@xyflow/react", () => ({
     <div data-testid={`handle-${type}`} data-position={position} />
   ),
   Position: { Left: "left", Right: "right" },
+  useNodeId: () => "test-node-id",
+}));
+
+vi.mock("@store/runSlice", () => ({
+  useRunStore: Object.assign(
+    (selector: (s: { activeNodeId: string | null }) => unknown) =>
+      selector({ activeNodeId: null }),
+    { getState: () => ({ activeNodeId: null }) },
+  ),
 }));
 
 const defaultProps = {
diff --git a/packages/canvas/src/components/canvas/nodes/__tests__/EndNode.test.tsx b/packages/canvas/src/components/canvas/nodes/__tests__/EndNode.test.tsx
index fed9ebe..ab2fd4d 100644
--- a/packages/canvas/src/components/canvas/nodes/__tests__/EndNode.test.tsx
+++ b/packages/canvas/src/components/canvas/nodes/__tests__/EndNode.test.tsx
@@ -6,6 +6,15 @@ vi.mock("@xyflow/react", () => ({
     <div data-testid={`handle-${type}`} data-position={position} />
   ),
   Position: { Left: "left", Right: "right" },
+  useNodeId: () => "test-node-id",
+}));
+
+vi.mock("@store/runSlice", () => ({
+  useRunStore: Object.assign(
+    (selector: (s: { activeNodeId: string | null }) => unknown) =>
+      selector({ activeNodeId: null }),
+    { getState: () => ({ activeNodeId: null }) },
+  ),
 }));
 
 const defaultProps = {
diff --git a/packages/canvas/src/components/canvas/nodes/__tests__/LLMNode.test.tsx b/packages/canvas/src/components/canvas/nodes/__tests__/LLMNode.test.tsx
index 0dbadbc..a728b17 100644
--- a/packages/canvas/src/components/canvas/nodes/__tests__/LLMNode.test.tsx
+++ b/packages/canvas/src/components/canvas/nodes/__tests__/LLMNode.test.tsx
@@ -6,6 +6,15 @@ vi.mock("@xyflow/react", () => ({
     <div data-testid={`handle-${type}`} data-position={position} />
   ),
   Position: { Left: "left", Right: "right" },
+  useNodeId: () => "test-node-id",
+}));
+
+vi.mock("@store/runSlice", () => ({
+  useRunStore: Object.assign(
+    (selector: (s: { activeNodeId: string | null }) => unknown) =>
+      selector({ activeNodeId: null }),
+    { getState: () => ({ activeNodeId: null }) },
+  ),
 }));
 
 const defaultProps = {
diff --git a/packages/canvas/src/components/canvas/nodes/__tests__/StartNode.test.tsx b/packages/canvas/src/components/canvas/nodes/__tests__/StartNode.test.tsx
index 03adc7b..336aa8d 100644
--- a/packages/canvas/src/components/canvas/nodes/__tests__/StartNode.test.tsx
+++ b/packages/canvas/src/components/canvas/nodes/__tests__/StartNode.test.tsx
@@ -6,6 +6,15 @@ vi.mock("@xyflow/react", () => ({
     <div data-testid={`handle-${type}`} data-position={position} />
   ),
   Position: { Left: "left", Right: "right" },
+  useNodeId: () => "test-node-id",
+}));
+
+vi.mock("@store/runSlice", () => ({
+  useRunStore: Object.assign(
+    (selector: (s: { activeNodeId: string | null }) => unknown) =>
+      selector({ activeNodeId: null }),
+    { getState: () => ({ activeNodeId: null }) },
+  ),
 }));
 
 const defaultProps = {
diff --git a/packages/canvas/src/components/panels/ResumeForm.tsx b/packages/canvas/src/components/panels/ResumeForm.tsx
new file mode 100644
index 0000000..4e3ddfe
--- /dev/null
+++ b/packages/canvas/src/components/panels/ResumeForm.tsx
@@ -0,0 +1,33 @@
+import { Button } from "@ui/Button";
+import { Input } from "@ui/Input";
+import { useState } from "react";
+
+interface ResumeFormProps {
+  prompt: string;
+  onSubmit: (input: unknown) => void;
+}
+
+export function ResumeForm({ prompt, onSubmit }: ResumeFormProps) {
+  const [value, setValue] = useState("");
+
+  return (
+    <div className="border-t border-zinc-700 pt-3">
+      <p className="mb-2 text-sm text-zinc-300">{prompt}</p>
+      <div className="flex gap-2">
+        <Input
+          value={value}
+          onChange={(e) => setValue(e.target.value)}
+          placeholder="Type your response..."
+          className="flex-1"
+        />
+        <Button
+          variant="primary"
+          onClick={() => onSubmit(value)}
+          disabled={!value.trim()}
+        >
+          Resume
+        </Button>
+      </div>
+    </div>
+  );
+}
diff --git a/packages/canvas/src/components/panels/RunEventItem.tsx b/packages/canvas/src/components/panels/RunEventItem.tsx
new file mode 100644
index 0000000..b735fc4
--- /dev/null
+++ b/packages/canvas/src/components/panels/RunEventItem.tsx
@@ -0,0 +1,104 @@
+import type { GraphEvent } from "@shared/events";
+import {
+  AlertTriangle,
+  ArrowRight,
+  CheckCircle,
+  Circle,
+  Loader,
+  Pause,
+  Play,
+  XCircle,
+} from "lucide-react";
+
+interface RunEventItemProps {
+  event: GraphEvent;
+}
+
+function formatDuration(ms: number): string {
+  if (ms < 1000) return `${ms}ms`;
+  return `${(ms / 1000).toFixed(1)}s`;
+}
+
+export function RunEventItem({ event }: RunEventItemProps) {
+  switch (event.event) {
+    case "run_started":
+      return (
+        <div className="flex items-center gap-2 text-xs text-blue-400">
+          <Play size={12} />
+          <span>Run started</span>
+        </div>
+      );
+
+    case "node_started":
+      return (
+        <div className="flex items-center gap-2 text-xs text-amber-400">
+          <Loader size={12} className="animate-spin" />
+          <span>{event.data.node_id}</span>
+        </div>
+      );
+
+    case "node_completed":
+      return (
+        <div className="flex items-center gap-2 text-xs text-green-400">
+          <CheckCircle size={12} />
+          <span>
+            {event.data.node_id}{" "}
+            <span className="text-zinc-500">
+              {formatDuration(event.data.duration_ms)}
+            </span>
+          </span>
+        </div>
+      );
+
+    case "edge_traversed":
+      return (
+        <div className="flex items-center gap-2 text-xs text-zinc-500">
+          <ArrowRight size={12} />
+          <span>
+            {event.data.from} → {event.data.to}
+          </span>
+        </div>
+      );
+
+    case "graph_paused":
+      return (
+        <div className="flex items-center gap-2 text-xs text-amber-400">
+          <Pause size={12} />
+          <span>Paused: {event.data.prompt}</span>
+        </div>
+      );
+
+    case "graph_completed":
+      return (
+        <div className="flex items-center gap-2 text-xs text-green-400">
+          <CheckCircle size={12} />
+          <span>
+            Completed{" "}
+            <span className="text-zinc-500">
+              {formatDuration(event.data.duration_ms)}
+            </span>
+          </span>
+        </div>
+      );
+
+    case "error":
+      return (
+        <div className="flex items-center gap-2 text-xs text-red-400">
+          {event.data.recoverable ? (
+            <AlertTriangle size={12} />
+          ) : (
+            <XCircle size={12} />
+          )}
+          <span>{event.data.message}</span>
+        </div>
+      );
+
+    default:
+      return (
+        <div className="flex items-center gap-2 text-xs text-zinc-500">
+          <Circle size={12} />
+          <span>Unknown event</span>
+        </div>
+      );
+  }
+}
diff --git a/packages/canvas/src/components/panels/RunPanel.tsx b/packages/canvas/src/components/panels/RunPanel.tsx
new file mode 100644
index 0000000..7943c7b
--- /dev/null
+++ b/packages/canvas/src/components/panels/RunPanel.tsx
@@ -0,0 +1,83 @@
+import { useRunStore } from "@store/runSlice";
+import { Sheet } from "@ui/Sheet";
+import { useEffect, useRef, useState } from "react";
+import { ResumeForm } from "./ResumeForm";
+import { RunEventItem } from "./RunEventItem";
+
+function formatDuration(ms: number | null): string {
+  if (ms == null) return "";
+  if (ms < 1000) return `${ms}ms`;
+  return `${(ms / 1000).toFixed(1)}s`;
+}
+
+export function RunPanel() {
+  const runStatus = useRunStore((s) => s.runStatus);
+  const runOutput = useRunStore((s) => s.runOutput);
+  const durationMs = useRunStore((s) => s.durationMs);
+  const errorMessage = useRunStore((s) => s.errorMessage);
+  const pausedPrompt = useRunStore((s) => s.pausedPrompt);
+  const [visible, setVisible] = useState(false);
+
+  const endRef = useRef<HTMLDivElement>(null);
+
+  // Auto-open when run starts, keep open until dismissed
+  useEffect(() => {
+    if (runStatus !== "idle") {
+      setVisible(true);
+    }
+  }, [runStatus]);
+
+  // Auto-scroll to bottom on new events
+  const eventCount = runOutput.length;
+  useEffect(() => {
+    if (eventCount > 0) {
+      endRef.current?.scrollIntoView({ behavior: "smooth" });
+    }
+  }, [eventCount]);
+
+  if (runStatus === "idle" && !visible) return null;
+
+  const title =
+    runStatus === "completed"
+      ? `Run completed ${formatDuration(durationMs)}`
+      : runStatus === "error"
+        ? "Run failed"
+        : runStatus === "paused"
+          ? "Run paused"
+          : runStatus === "connection_lost"
+            ? "Connection lost"
+            : "Running...";
+
+  return (
+    <Sheet
+      open={visible}
+      onClose={() => setVisible(false)}
+      title={title}
+      side="bottom"
+    >
+      <div className="flex flex-col gap-1.5">
+        {runOutput.map((event, i) => (
+          // biome-ignore lint/suspicious/noArrayIndexKey: events are append-only, index is stable
+          <RunEventItem key={i} event={event} />
+        ))}
+        {runStatus === "error" && errorMessage && (
+          <div className="mt-2 rounded border border-red-800 bg-red-950/50 px-3 py-2 text-xs text-red-400">
+            {errorMessage}
+          </div>
+        )}
+        {runStatus === "connection_lost" && (
+          <div className="mt-2 rounded border border-amber-800 bg-amber-950/50 px-3 py-2 text-xs text-amber-400">
+            Connection lost — the run may still be executing on the server.
+          </div>
+        )}
+        {runStatus === "paused" && pausedPrompt && (
+          <ResumeForm
+            prompt={pausedPrompt}
+            onSubmit={(input) => useRunStore.getState().resumeRun(input)}
+          />
+        )}
+        <div ref={endRef} />
+      </div>
+    </Sheet>
+  );
+}
diff --git a/packages/canvas/src/components/ui/Sheet.tsx b/packages/canvas/src/components/ui/Sheet.tsx
index a26475b..82c91cd 100644
--- a/packages/canvas/src/components/ui/Sheet.tsx
+++ b/packages/canvas/src/components/ui/Sheet.tsx
@@ -2,7 +2,7 @@ import { X } from "lucide-react";
 import type { ReactNode } from "react";
 import { IconButton } from "./IconButton";
 
-type SheetSide = "left" | "right";
+type SheetSide = "left" | "right" | "bottom";
 
 interface SheetProps {
   open: boolean;
@@ -14,17 +14,34 @@ interface SheetProps {
 
 const sideClasses: Record<
   SheetSide,
-  { position: string; border: string; transform: string }
+  {
+    position: string;
+    border: string;
+    openTransform: string;
+    closedTransform: string;
+    size: string;
+  }
 > = {
   left: {
-    position: "left-0",
+    position: "left-0 top-0",
     border: "border-r",
-    transform: "-translate-x-full",
+    openTransform: "translate-x-0",
+    closedTransform: "-translate-x-full",
+    size: "h-full w-80",
   },
   right: {
-    position: "right-0",
+    position: "right-0 top-0",
     border: "border-l",
-    transform: "translate-x-full",
+    openTransform: "translate-x-0",
+    closedTransform: "translate-x-full",
+    size: "h-full w-80",
+  },
+  bottom: {
+    position: "inset-x-0 bottom-0",
+    border: "border-t",
+    openTransform: "translate-y-0",
+    closedTransform: "translate-y-full",
+    size: "w-full h-64",
   },
 };
 
@@ -35,11 +52,12 @@ export function Sheet({
   side = "right",
   children,
 }: SheetProps) {
-  const { position, border, transform } = sideClasses[side];
+  const { position, border, openTransform, closedTransform, size } =
+    sideClasses[side];
 
   return (
     <div
-      className={`absolute ${position} top-0 z-20 h-full w-80 ${border} border-zinc-800 bg-zinc-900 shadow-xl transition-transform duration-200 ease-in-out ${open ? "translate-x-0" : transform}`}
+      className={`absolute ${position} z-20 ${size} ${border} border-zinc-800 bg-zinc-900 shadow-xl transition-transform duration-200 ease-in-out ${open ? openTransform : closedTransform}`}
       // biome-ignore lint/a11y/useSemanticElements: Sheet uses div+role instead of <dialog> to avoid modal backdrop and enable CSS slide transitions
       role="dialog"
       aria-label={title}
diff --git a/packages/canvas/src/store/__tests__/runSlice.test.ts b/packages/canvas/src/store/__tests__/runSlice.test.ts
new file mode 100644
index 0000000..cd67a3c
--- /dev/null
+++ b/packages/canvas/src/store/__tests__/runSlice.test.ts
@@ -0,0 +1,377 @@
+import type { GraphEvent } from "@shared/events";
+import { useRunStore } from "../runSlice";
+
+// ---------------------------------------------------------------------------
+// Mocks
+// ---------------------------------------------------------------------------
+
+vi.mock("@api/runs", () => ({
+  startRun: vi.fn(),
+  connectStream: vi.fn(() => vi.fn()),
+  cancelRun: vi.fn(),
+  resumeRun: vi.fn(),
+  getRunStatus: vi.fn(),
+}));
+
+vi.mock("@api/client", () => ({
+  ApiError: class ApiError extends Error {
+    status: number;
+    constructor(message: string, status: number) {
+      super(message);
+      this.status = status;
+    }
+  },
+}));
+
+vi.mock("@store/uiSlice", () => ({
+  useUIStore: { getState: () => ({ showToast: vi.fn() }) },
+}));
+
+const runsApi = await import("@api/runs");
+
+let mockCleanup: ReturnType<typeof vi.fn>;
+
+beforeEach(() => {
+  vi.clearAllMocks();
+  mockCleanup = vi.fn();
+  vi.mocked(runsApi.connectStream).mockReturnValue(mockCleanup as () => void);
+  useRunStore.setState({
+    activeRunId: null,
+    runStatus: "idle",
+    activeNodeId: null,
+    runOutput: [],
+    reconnectAttempts: 0,
+    lastEventId: 0,
+    finalState: null,
+    durationMs: null,
+    errorMessage: null,
+    pausedPrompt: null,
+  });
+});
+
+// ---------------------------------------------------------------------------
+// Helpers
+// ---------------------------------------------------------------------------
+
+function event<E extends GraphEvent["event"]>(
+  type: E,
+  data: Extract<GraphEvent, { event: E }>["data"],
+): GraphEvent {
+  return { event: type, data } as GraphEvent;
+}
+
+// ---------------------------------------------------------------------------
+// startRun
+// ---------------------------------------------------------------------------
+
+describe("startRun", () => {
+  it("transitions idle → running and sets activeRunId", async () => {
+    vi.mocked(runsApi.startRun).mockResolvedValue({
+      run_id: "r1",
+      status: "running",
+    });
+    await useRunStore.getState().startRun("g1");
+    const s = useRunStore.getState();
+    expect(s.runStatus).toBe("running");
+    expect(s.activeRunId).toBe("r1");
+  });
+
+  it("connects SSE stream after API call", async () => {
+    vi.mocked(runsApi.startRun).mockResolvedValue({
+      run_id: "r1",
+      status: "running",
+    });
+    await useRunStore.getState().startRun("g1");
+    expect(runsApi.connectStream).toHaveBeenCalledWith(
+      "r1",
+      expect.objectContaining({ onEvent: expect.any(Function) }),
+    );
+  });
+
+  it("sets error status and message on API failure", async () => {
+    const { ApiError } = await import("@api/client");
+    vi.mocked(runsApi.startRun).mockRejectedValue(
+      new ApiError("Validation failed", 422),
+    );
+    await useRunStore.getState().startRun("g1");
+    const s = useRunStore.getState();
+    expect(s.runStatus).toBe("error");
+    expect(s.errorMessage).toBe("Validation failed");
+  });
+
+  it("passes graphId raw to API (no double-encoding)", async () => {
+    vi.mocked(runsApi.startRun).mockResolvedValue({
+      run_id: "r1",
+      status: "running",
+    });
+    await useRunStore.getState().startRun("my graph#1");
+    expect(runsApi.startRun).toHaveBeenCalledWith("my graph#1", undefined);
+  });
+});
+
+// ---------------------------------------------------------------------------
+// _handleEvent
+// ---------------------------------------------------------------------------
+
+describe("_handleEvent", () => {
+  it("run_started sets running status", () => {
+    useRunStore.setState({ runStatus: "running" });
+    useRunStore
+      .getState()
+      ._handleEvent(event("run_started", { run_id: "r1", timestamp: "t" }), 1);
+    expect(useRunStore.getState().runStatus).toBe("running");
+    expect(useRunStore.getState().runOutput).toHaveLength(1);
+  });
+
+  it("node_started sets activeNodeId", () => {
+    useRunStore.setState({ runStatus: "running" });
+    useRunStore
+      .getState()
+      ._handleEvent(
+        event("node_started", { node_id: "n1", timestamp: "t" }),
+        2,
+      );
+    expect(useRunStore.getState().activeNodeId).toBe("n1");
+  });
+
+  it("node_completed appends to output", () => {
+    useRunStore.setState({ runStatus: "running", activeNodeId: "n1" });
+    useRunStore.getState()._handleEvent(
+      event("node_completed", {
+        node_id: "n1",
+        output: {},
+        state_snapshot: {},
+        duration_ms: 100,
+      }),
+      3,
+    );
+    // activeNodeId stays until next node_started
+    expect(useRunStore.getState().activeNodeId).toBe("n1");
+    expect(useRunStore.getState().runOutput).toHaveLength(1);
+  });
+
+  it("graph_paused sets paused status and prompt", () => {
+    useRunStore.setState({ runStatus: "running" });
+    useRunStore.getState()._handleEvent(
+      event("graph_paused", {
+        node_id: "n1",
+        prompt: "What next?",
+        run_id: "r1",
+      }),
+      4,
+    );
+    const s = useRunStore.getState();
+    expect(s.runStatus).toBe("paused");
+    expect(s.pausedPrompt).toBe("What next?");
+    expect(s.activeNodeId).toBe("n1");
+  });
+
+  it("graph_completed sets completed status with final state", () => {
+    useRunStore.setState({ runStatus: "running" });
+    useRunStore.getState()._handleEvent(
+      event("graph_completed", {
+        final_state: { result: "ok" },
+        duration_ms: 500,
+      }),
+      5,
+    );
+    const s = useRunStore.getState();
+    expect(s.runStatus).toBe("completed");
+    expect(s.activeNodeId).toBeNull();
+    expect(s.finalState).toEqual({ result: "ok" });
+    expect(s.durationMs).toBe(500);
+  });
+
+  it("non-recoverable error sets error status", () => {
+    useRunStore.setState({ runStatus: "running", activeNodeId: "n1" });
+    useRunStore.getState()._handleEvent(
+      event("error", {
+        node_id: "n1",
+        message: "LLM failed",
+        recoverable: false,
+      }),
+      6,
+    );
+    const s = useRunStore.getState();
+    expect(s.runStatus).toBe("error");
+    expect(s.errorMessage).toBe("LLM failed");
+  });
+
+  it("recoverable error does not change status", () => {
+    useRunStore.setState({ runStatus: "running" });
+    useRunStore.getState()._handleEvent(
+      event("error", {
+        message: "Rate limited, retrying",
+        recoverable: true,
+      }),
+      7,
+    );
+    expect(useRunStore.getState().runStatus).toBe("running");
+    expect(useRunStore.getState().runOutput).toHaveLength(1);
+  });
+
+  it("tracks lastEventId", () => {
+    useRunStore.setState({ runStatus: "running" });
+    useRunStore
+      .getState()
+      ._handleEvent(event("run_started", { run_id: "r1", timestamp: "t" }), 5);
+    expect(useRunStore.getState().lastEventId).toBe(5);
+  });
+
+  it("onerror after graph_completed does not change status", () => {
+    useRunStore.setState({ runStatus: "running" });
+    // Terminal event
+    useRunStore.getState()._handleEvent(
+      event("graph_completed", {
+        final_state: {},
+        duration_ms: 100,
+      }),
+      10,
+    );
+    expect(useRunStore.getState().runStatus).toBe("completed");
+    // onerror fires after EventSource.close()
+    useRunStore.getState()._handleStreamError(new Error("connection lost"));
+    expect(useRunStore.getState().runStatus).toBe("completed");
+  });
+});
+
+// ---------------------------------------------------------------------------
+// cancelRun
+// ---------------------------------------------------------------------------
+
+describe("cancelRun", () => {
+  it("sends cancel and resets to idle", async () => {
+    vi.mocked(runsApi.cancelRun).mockResolvedValue(undefined);
+    useRunStore.setState({ activeRunId: "r1", runStatus: "running" });
+    await useRunStore.getState().cancelRun();
+    expect(runsApi.cancelRun).toHaveBeenCalledWith("r1");
+    expect(useRunStore.getState().runStatus).toBe("idle");
+  });
+
+  it("does nothing when no active run", async () => {
+    await useRunStore.getState().cancelRun();
+    expect(runsApi.cancelRun).not.toHaveBeenCalled();
+  });
+});
+
+// ---------------------------------------------------------------------------
+// resumeRun
+// ---------------------------------------------------------------------------
+
+describe("resumeRun", () => {
+  it("opens SSE before calling resume API (race condition fix)", async () => {
+    vi.mocked(runsApi.resumeRun).mockResolvedValue({ status: "resumed" });
+    useRunStore.setState({ activeRunId: "r1", runStatus: "paused" });
+
+    const callOrder: string[] = [];
+    vi.mocked(runsApi.connectStream).mockImplementation(() => {
+      callOrder.push("connectStream");
+      return vi.fn();
+    });
+    vi.mocked(runsApi.resumeRun).mockImplementation(async () => {
+      callOrder.push("resumeRun");
+      return { status: "resumed" };
+    });
+
+    await useRunStore.getState().resumeRun("user input");
+    expect(callOrder).toEqual(["connectStream", "resumeRun"]);
+  });
+
+  it("sets running status and clears pausedPrompt", async () => {
+    vi.mocked(runsApi.resumeRun).mockResolvedValue({ status: "resumed" });
+    useRunStore.setState({
+      activeRunId: "r1",
+      runStatus: "paused",
+      pausedPrompt: "What?",
+    });
+    await useRunStore.getState().resumeRun("answer");
+    expect(useRunStore.getState().runStatus).toBe("running");
+    expect(useRunStore.getState().pausedPrompt).toBeNull();
+  });
+});
+
+// ---------------------------------------------------------------------------
+// resetRun
+// ---------------------------------------------------------------------------
+
+describe("resetRun", () => {
+  it("cleans up everything", () => {
+    useRunStore.setState({
+      activeRunId: "r1",
+      runStatus: "running",
+      activeNodeId: "n1",
+      runOutput: [event("run_started", { run_id: "r1", timestamp: "t" })],
+    });
+    useRunStore.getState().resetRun();
+    const s = useRunStore.getState();
+    expect(s.runStatus).toBe("idle");
+    expect(s.activeRunId).toBeNull();
+    expect(s.activeNodeId).toBeNull();
+    expect(s.runOutput).toEqual([]);
+  });
+});
+
+// ---------------------------------------------------------------------------
+// _handleStreamError
+// ---------------------------------------------------------------------------
+
+describe("_handleStreamError", () => {
+  it("sets reconnecting and attempts status recovery", async () => {
+    vi.useFakeTimers();
+    vi.mocked(runsApi.getRunStatus).mockResolvedValue({
+      run_id: "r1",
+      graph_id: "g1",
+      status: "completed",
+      node_id: null,
+      prompt: null,
+      final_state: { done: true },
+      duration_ms: 500,
+      error: null,
+    });
+    useRunStore.setState({ activeRunId: "r1", runStatus: "running" });
+    const promise = useRunStore
+      .getState()
+      ._handleStreamError(new Error("lost"));
+    expect(useRunStore.getState().runStatus).toBe("reconnecting");
+    expect(useRunStore.getState().reconnectAttempts).toBe(1);
+    await vi.advanceTimersByTimeAsync(1000);
+    await promise;
+    expect(useRunStore.getState().runStatus).toBe("completed");
+    expect(useRunStore.getState().finalState).toEqual({ done: true });
+    vi.useRealTimers();
+  });
+
+  it("gives up after 3 failed attempts", async () => {
+    vi.useFakeTimers();
+    vi.mocked(runsApi.getRunStatus).mockRejectedValue(new Error("network"));
+    useRunStore.setState({ activeRunId: "r1", runStatus: "running" });
+
+    // Attempt 1
+    const promise = useRunStore
+      .getState()
+      ._handleStreamError(new Error("lost"));
+    await vi.advanceTimersByTimeAsync(1000);
+    await promise;
+    // Attempt 2 (recursive from catch)
+    await vi.advanceTimersByTimeAsync(2000);
+    // Attempt 3
+    await vi.advanceTimersByTimeAsync(4000);
+    // Allow all microtasks
+    await vi.advanceTimersByTimeAsync(10000);
+
+    expect(useRunStore.getState().runStatus).toBe("connection_lost");
+    vi.useRealTimers();
+  });
+
+  it("ignores error when already completed", () => {
+    useRunStore.setState({ runStatus: "completed" });
+    useRunStore.getState()._handleStreamError(new Error("lost"));
+    expect(useRunStore.getState().runStatus).toBe("completed");
+  });
+
+  it("ignores error when no activeRunId", () => {
+    useRunStore.setState({ runStatus: "running", activeRunId: null });
+    useRunStore.getState()._handleStreamError(new Error("lost"));
+    expect(useRunStore.getState().runStatus).toBe("running");
+  });
+});
diff --git a/packages/canvas/src/store/runSlice.ts b/packages/canvas/src/store/runSlice.ts
index b7a4fc2..8cd41b5 100644
--- a/packages/canvas/src/store/runSlice.ts
+++ b/packages/canvas/src/store/runSlice.ts
@@ -1,6 +1,19 @@
+import { ApiError } from "@api/client";
+import {
+  cancelRun as cancelRunApi,
+  connectStream,
+  getRunStatus,
+  resumeRun as resumeRunApi,
+  startRun as startRunApi,
+} from "@api/runs";
 import type { GraphEvent } from "@shared/events";
+import { useUIStore } from "@store/uiSlice";
 import { create } from "zustand";
 
+// ---------------------------------------------------------------------------
+// Types
+// ---------------------------------------------------------------------------
+
 export type RunStatus =
   | "idle"
   | "running"
@@ -16,25 +29,288 @@ export interface RunSlice {
   activeNodeId: string | null;
   runOutput: GraphEvent[];
   reconnectAttempts: number;
-  startRun: (input: unknown) => Promise<void>;
-  resumeRun: (input: string) => Promise<void>;
-  cancelRun: () => void;
+  lastEventId: number;
+  finalState: unknown | null;
+  durationMs: number | null;
+  errorMessage: string | null;
+  pausedPrompt: string | null;
+
+  startRun: (graphId: string, input?: Record<string, unknown>) => Promise<void>;
+  cancelRun: () => Promise<void>;
+  resumeRun: (input: unknown) => Promise<void>;
+  resetRun: () => void;
+
+  /** @internal — called by SSE event handlers */
+  _handleEvent: (event: GraphEvent, eventId: number | null) => void;
+  /** @internal — called on SSE connection error */
+  _handleStreamError: (error: Error) => void;
+  /** @internal — close the current SSE connection */
+  _disconnect: () => void;
 }
 
-export const useRunStore = create<RunSlice>((set) => ({
+// ---------------------------------------------------------------------------
+// Private state (module closure — not serializable, not needed by components)
+// ---------------------------------------------------------------------------
+
+let cleanup: (() => void) | null = null;
+let terminalReceived = false;
+let reconnecting = false;
+
+const MAX_RECONNECT_ATTEMPTS = 3;
+
+function sleep(ms: number): Promise<void> {
+  return new Promise((resolve) => setTimeout(resolve, ms));
+}
+
+const INITIAL_STATE = {
   activeRunId: null,
-  runStatus: "idle",
+  runStatus: "idle" as RunStatus,
   activeNodeId: null,
-  runOutput: [],
+  runOutput: [] as GraphEvent[],
   reconnectAttempts: 0,
-  startRun: async (_input) => {
-    set({ runStatus: "running" });
-    // TODO: implement SSE connection
+  lastEventId: 0,
+  finalState: null,
+  durationMs: null,
+  errorMessage: null,
+  pausedPrompt: null,
+};
+
+function showToast(
+  message: string,
+  variant: "error" | "success" | "info" = "error",
+) {
+  useUIStore.getState().showToast(message, variant);
+}
+
+// ---------------------------------------------------------------------------
+// Store
+// ---------------------------------------------------------------------------
+
+export const useRunStore = create<RunSlice>((set) => ({
+  ...INITIAL_STATE,
+
+  startRun: async (graphId, input) => {
+    cleanup?.();
+    cleanup = null;
+    terminalReceived = false;
+    reconnecting = false;
+    set({
+      ...INITIAL_STATE,
+      runStatus: "running",
+    });
+
+    try {
+      const { run_id } = await startRunApi(graphId, input);
+      set({ activeRunId: run_id });
+
+      const { _handleEvent, _handleStreamError } = useRunStore.getState();
+      cleanup = connectStream(run_id, {
+        onEvent: _handleEvent,
+        onError: _handleStreamError,
+      });
+    } catch (err) {
+      const message =
+        err instanceof ApiError ? err.message : "Failed to start run";
+      set({ runStatus: "error", errorMessage: message });
+      showToast(message);
+    }
+  },
+
+  cancelRun: async () => {
+    const { activeRunId } = useRunStore.getState();
+    if (!activeRunId) return;
+
+    cleanup?.();
+    cleanup = null;
+
+    try {
+      await cancelRunApi(activeRunId);
+    } catch {
+      // Best-effort — run may have already completed
+    }
+    set({ runStatus: "idle", activeNodeId: null });
+  },
+
+  resumeRun: async (input) => {
+    const { activeRunId, _handleEvent, _handleStreamError } =
+      useRunStore.getState();
+    if (!activeRunId) return;
+
+    // Close old connection, open new one BEFORE the resume POST
+    // (race condition fix — server waits 2s for SSE listener)
+    cleanup?.();
+    cleanup = connectStream(activeRunId, {
+      onEvent: _handleEvent,
+      onError: _handleStreamError,
+    });
+
+    set({ runStatus: "running", pausedPrompt: null });
+
+    try {
+      await resumeRunApi(activeRunId, input);
+    } catch (err) {
+      const message =
+        err instanceof ApiError ? err.message : "Failed to resume run";
+      set({ runStatus: "error", errorMessage: message });
+      showToast(message);
+    }
+  },
+
+  resetRun: () => {
+    cleanup?.();
+    cleanup = null;
+    terminalReceived = false;
+    reconnecting = false;
+    set(INITIAL_STATE);
   },
-  resumeRun: async (_input) => {
-    // TODO: implement resume flow
+
+  _handleEvent: (event, eventId) => {
+    // Close connection on terminal events BEFORE updating state.
+    // Set terminalReceived to prevent onerror → reconnection race.
+    if (
+      event.event === "graph_completed" ||
+      (event.event === "error" && !event.data.recoverable)
+    ) {
+      terminalReceived = true;
+      cleanup?.();
+      cleanup = null;
+    }
+
+    set((s) => {
+      const output = [...s.runOutput, event];
+      const base = { runOutput: output, lastEventId: eventId ?? s.lastEventId };
+
+      switch (event.event) {
+        case "run_started":
+          return { ...base, runStatus: "running" as const };
+
+        case "node_started":
+          return { ...base, activeNodeId: event.data.node_id };
+
+        case "node_completed":
+          return base;
+
+        case "edge_traversed":
+          return base;
+
+        case "graph_paused":
+          return {
+            ...base,
+            runStatus: "paused" as const,
+            activeNodeId: event.data.node_id,
+            pausedPrompt: event.data.prompt,
+          };
+
+        case "graph_completed":
+          return {
+            ...base,
+            runStatus: "completed" as const,
+            activeNodeId: null,
+            finalState: event.data.final_state,
+            durationMs: event.data.duration_ms,
+          };
+
+        case "error":
+          if (!event.data.recoverable) {
+            return {
+              ...base,
+              runStatus: "error" as const,
+              activeNodeId: event.data.node_id ?? s.activeNodeId,
+              errorMessage: event.data.message,
+            };
+          }
+          return base;
+
+        default:
+          return base;
+      }
+    });
   },
-  cancelRun: () => {
-    set({ runStatus: "idle", activeRunId: null });
+
+  _handleStreamError: async (_error) => {
+    if (terminalReceived) return;
+    if (reconnecting) return;
+
+    cleanup = null;
+    const state = useRunStore.getState();
+    if (state.runStatus !== "running" && state.runStatus !== "reconnecting") {
+      return;
+    }
+    if (!state.activeRunId) return;
+
+    const attempt = state.reconnectAttempts + 1;
+    if (attempt > MAX_RECONNECT_ATTEMPTS) {
+      reconnecting = false;
+      set({
+        runStatus: "connection_lost",
+        errorMessage: "Connection lost after 3 attempts",
+      });
+      showToast("Connection lost — run may still be executing on the server");
+      return;
+    }
+
+    reconnecting = true;
+    set({ runStatus: "reconnecting", reconnectAttempts: attempt });
+
+    // Exponential backoff: 1s, 2s, 4s
+    await sleep(1000 * 2 ** (attempt - 1));
+
+    try {
+      const status = await getRunStatus(state.activeRunId);
+
+      switch (status.status) {
+        case "completed":
+          reconnecting = false;
+          set({
+            runStatus: "completed",
+            finalState: status.final_state,
+            durationMs: status.duration_ms,
+            activeNodeId: null,
+          });
+          break;
+
+        case "running": {
+          reconnecting = false;
+          const { _handleEvent, _handleStreamError, lastEventId } =
+            useRunStore.getState();
+          cleanup = connectStream(
+            state.activeRunId,
+            { onEvent: _handleEvent, onError: _handleStreamError },
+            lastEventId,
+          );
+          set({ runStatus: "running", reconnectAttempts: 0 });
+          break;
+        }
+
+        case "paused":
+          reconnecting = false;
+          set({
+            runStatus: "paused",
+            activeNodeId: status.node_id,
+            pausedPrompt: status.prompt,
+          });
+          break;
+
+        case "error":
+          reconnecting = false;
+          set({
+            runStatus: "error",
+            errorMessage: status.error ?? "Run failed on server",
+            activeNodeId: null,
+          });
+          break;
+      }
+    } catch {
+      // Status check failed — retry
+      reconnecting = false;
+      useRunStore
+        .getState()
+        ._handleStreamError(new Error("Status check failed"));
+    }
+  },
+
+  _disconnect: () => {
+    cleanup?.();
+    cleanup = null;
   },
 }));
diff --git a/packages/canvas/src/utils/__tests__/validateGraph.test.ts b/packages/canvas/src/utils/__tests__/validateGraph.test.ts
new file mode 100644
index 0000000..0cad1da
--- /dev/null
+++ b/packages/canvas/src/utils/__tests__/validateGraph.test.ts
@@ -0,0 +1,116 @@
+import type { EdgeSchema, NodeSchema } from "@shared/schema";
+import { validateGraph } from "../validateGraph";
+
+function makeNode(
+  overrides: Partial<NodeSchema> & { type: NodeSchema["type"] },
+): NodeSchema {
+  return {
+    id: crypto.randomUUID(),
+    label: overrides.type.charAt(0).toUpperCase() + overrides.type.slice(1),
+    position: { x: 0, y: 0 },
+    config: {},
+    ...overrides,
+  } as NodeSchema;
+}
+
+function edge(source: string, target: string): EdgeSchema {
+  return { id: `e-${source}-${target}`, source, target };
+}
+
+describe("validateGraph", () => {
+  it("valid Start → LLM → End passes", () => {
+    const start = makeNode({ type: "start" });
+    const llm = makeNode({
+      type: "llm",
+      config: {
+        provider: "openai",
+        model: "gpt-4",
+        system_prompt: "You are helpful",
+        temperature: 0.7,
+        max_tokens: 1000,
+        input_map: {},
+        output_key: "response",
+      },
+    });
+    const end = makeNode({ type: "end" });
+    const nodes = [start, llm, end];
+    const edges = [edge(start.id, llm.id), edge(llm.id, end.id)];
+    expect(validateGraph(nodes, edges)).toEqual([]);
+  });
+
+  it("rejects graph with no Start node", () => {
+    const end = makeNode({ type: "end" });
+    const errors = validateGraph([end], []);
+    expect(errors).toContainEqual(
+      expect.objectContaining({ message: "Start node required" }),
+    );
+  });
+
+  it("rejects graph with no End node", () => {
+    const start = makeNode({ type: "start" });
+    const errors = validateGraph([start], []);
+    expect(errors).toContainEqual(
+      expect.objectContaining({ message: "End node required" }),
+    );
+  });
+
+  it("rejects multiple Start nodes", () => {
+    const s1 = makeNode({ type: "start" });
+    const s2 = makeNode({ type: "start" });
+    const end = makeNode({ type: "end" });
+    const errors = validateGraph([s1, s2, end], []);
+    expect(errors).toContainEqual(
+      expect.objectContaining({
+        message: "Only one Start node allowed",
+        nodeId: s2.id,
+      }),
+    );
+  });
+
+  it("rejects disconnected node (no outgoing)", () => {
+    const start = makeNode({ type: "start" });
+    const llm = makeNode({
+      type: "llm",
+      label: "MyLLM",
+      config: {
+        provider: "openai",
+        model: "gpt-4",
+        system_prompt: "hi",
+        temperature: 0.7,
+        max_tokens: 1000,
+        input_map: {},
+        output_key: "r",
+      },
+    });
+    const end = makeNode({ type: "end" });
+    // start → end, llm is orphan
+    const errors = validateGraph([start, llm, end], [edge(start.id, end.id)]);
+    expect(errors).toContainEqual(expect.objectContaining({ nodeId: llm.id }));
+  });
+
+  it("rejects LLM without system prompt", () => {
+    const start = makeNode({ type: "start" });
+    const llm = makeNode({
+      type: "llm",
+      config: {
+        provider: "openai",
+        model: "gpt-4",
+        system_prompt: "",
+        temperature: 0.7,
+        max_tokens: 1000,
+        input_map: {},
+        output_key: "r",
+      },
+    });
+    const end = makeNode({ type: "end" });
+    const errors = validateGraph(
+      [start, llm, end],
+      [edge(start.id, llm.id), edge(llm.id, end.id)],
+    );
+    expect(errors).toContainEqual(
+      expect.objectContaining({
+        message: expect.stringContaining("system prompt"),
+      }),
+    );
+  });
+});
diff --git a/packages/canvas/src/utils/validateGraph.ts b/packages/canvas/src/utils/validateGraph.ts
new file mode 100644
index 0000000..33860ce
--- /dev/null
+++ b/packages/canvas/src/utils/validateGraph.ts
@@ -0,0 +1,67 @@
+import type { EdgeSchema, NodeSchema } from "@shared/schema";
+
+export interface ValidationError {
+  message: string;
+  nodeId?: string;
+}
+
+/** Client-side graph validation — fast feedback before hitting the server. */
+export function validateGraph(
+  nodes: NodeSchema[],
+  edges: EdgeSchema[],
+): ValidationError[] {
+  const errors: ValidationError[] = [];
+
+  // 1. Exactly one Start node
+  const starts = nodes.filter((n) => n.type === "start");
+  if (starts.length === 0) {
+    errors.push({ message: "Start node required" });
+  } else if (starts.length > 1 && starts[1]) {
+    errors.push({
+      message: "Only one Start node allowed",
+      nodeId: starts[1].id,
+    });
+  }
+
+  // 2. At least one End node
+  const ends = nodes.filter((n) => n.type === "end");
+  if (ends.length === 0) {
+    errors.push({ message: "End node required" });
+  }
+
+  // 3. All non-end nodes have at least one outgoing edge
+  const nodesWithOutgoing = new Set(edges.map((e) => e.source));
+  for (const node of nodes) {
+    if (node.type === "end") continue;
+    if (!nodesWithOutgoing.has(node.id)) {
+      errors.push({
+        nodeId: node.id,
+        message: `${node.label || node.type} node has no outgoing edge`,
+      });
+    }
+  }
+
+  // 4. All non-start nodes have at least one incoming edge
+  const nodesWithIncoming = new Set(edges.map((e) => e.target));
+  for (const node of nodes) {
+    if (node.type === "start") continue;
+    if (!nodesWithIncoming.has(node.id)) {
+      errors.push({
+        nodeId: node.id,
+        message: `${node.label || node.type} node has no incoming edge`,
+      });
+    }
+  }
+
+  // 5. LLM nodes have a system prompt
+  for (const node of nodes) {
+    if (node.type === "llm" && !node.config.system_prompt?.trim()) {
+      errors.push({
+        nodeId: node.id,
+        message: `${node.label || "LLM"} node needs a system prompt`,
+      });
+    }
+  }
+
+  return errors;
+}

From 03ada25a4303f858709d32772954e94e3b8c4e68 Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 17:42:59 -0700
Subject: [PATCH 3/9] fix(canvas): address code review findings for Phase 2

- Validate JSON input is a plain object (not string/array/null)
- Reset terminalReceived in resumeRun to prevent stale guard
- Add Number.isFinite guard on lastEventId query param
- Extract duplicate formatDuration to utils/format.ts

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 packages/canvas/src/api/runs.ts                        |  2 +-
 .../canvas/src/components/canvas/RunInputDialog.tsx    | 10 +++++++++-
 packages/canvas/src/components/panels/RunEventItem.tsx |  6 +-----
 packages/canvas/src/components/panels/RunPanel.tsx     |  7 +------
 packages/canvas/src/store/runSlice.ts                  |  1 +
 packages/canvas/src/utils/format.ts                    |  6 ++++++
 6 files changed, 19 insertions(+), 13 deletions(-)
 create mode 100644 packages/canvas/src/utils/format.ts

diff --git a/packages/canvas/src/api/runs.ts b/packages/canvas/src/api/runs.ts
index 107517e..92457f7 100644
--- a/packages/canvas/src/api/runs.ts
+++ b/packages/canvas/src/api/runs.ts
@@ -99,7 +99,7 @@ export function connectStream(
 ): () => void {
   const encoded = encodeURIComponent(runId);
   const params =
-    lastEventId != null && lastEventId > 0
+    lastEventId != null && Number.isFinite(lastEventId) && lastEventId > 0
       ? `?last_event_id=${lastEventId}`
       : "";
   const url = apiUrl(`/runs/${encoded}/stream${params}`);
diff --git a/packages/canvas/src/components/canvas/RunInputDialog.tsx b/packages/canvas/src/components/canvas/RunInputDialog.tsx
index 081a519..b7fe054 100644
--- a/packages/canvas/src/components/canvas/RunInputDialog.tsx
+++ b/packages/canvas/src/components/canvas/RunInputDialog.tsx
@@ -18,7 +18,15 @@ export function RunInputDialog({
 
   const handleSubmit = () => {
     try {
-      const parsed = JSON.parse(value);
+      const parsed: unknown = JSON.parse(value);
+      if (
+        typeof parsed !== "object" ||
+        parsed === null ||
+        Array.isArray(parsed)
+      ) {
+        setParseError("Input must be a JSON object");
+        return;
+      }
       setParseError(null);
       onSubmit(parsed as Record<string, unknown>);
     } catch {
diff --git a/packages/canvas/src/components/panels/RunEventItem.tsx b/packages/canvas/src/components/panels/RunEventItem.tsx
index b735fc4..61bfd6c 100644
--- a/packages/canvas/src/components/panels/RunEventItem.tsx
+++ b/packages/canvas/src/components/panels/RunEventItem.tsx
@@ -9,16 +9,12 @@ import {
   Play,
   XCircle,
 } from "lucide-react";
+import { formatDuration } from "../../utils/format";
 
 interface RunEventItemProps {
   event: GraphEvent;
 }
 
-function formatDuration(ms: number): string {
-  if (ms < 1000) return `${ms}ms`;
-  return `${(ms / 1000).toFixed(1)}s`;
-}
-
 export function RunEventItem({ event }: RunEventItemProps) {
   switch (event.event) {
     case "run_started":
diff --git a/packages/canvas/src/components/panels/RunPanel.tsx b/packages/canvas/src/components/panels/RunPanel.tsx
index 7943c7b..a9aa640 100644
--- a/packages/canvas/src/components/panels/RunPanel.tsx
+++ b/packages/canvas/src/components/panels/RunPanel.tsx
@@ -1,15 +1,10 @@
 import { useRunStore } from "@store/runSlice";
 import { Sheet } from "@ui/Sheet";
 import { useEffect, useRef, useState } from "react";
+import { formatDuration } from "../../utils/format";
 import { ResumeForm } from "./ResumeForm";
 import { RunEventItem } from "./RunEventItem";
 
-function formatDuration(ms: number | null): string {
-  if (ms == null) return "";
-  if (ms < 1000) return `${ms}ms`;
-  return `${(ms / 1000).toFixed(1)}s`;
-}
-
 export function RunPanel() {
   const runStatus = useRunStore((s) => s.runStatus);
   const runOutput = useRunStore((s) => s.runOutput);
diff --git a/packages/canvas/src/store/runSlice.ts b/packages/canvas/src/store/runSlice.ts
index 8cd41b5..3fc10b2 100644
--- a/packages/canvas/src/store/runSlice.ts
+++ b/packages/canvas/src/store/runSlice.ts
@@ -139,6 +139,7 @@ export const useRunStore = create<RunSlice>((set) => ({
     // Close old connection, open new one BEFORE the resume POST
     // (race condition fix — server waits 2s for SSE listener)
     cleanup?.();
+    terminalReceived = false;
     cleanup = connectStream(activeRunId, {
       onEvent: _handleEvent,
       onError: _handleStreamError,
diff --git a/packages/canvas/src/utils/format.ts b/packages/canvas/src/utils/format.ts
new file mode 100644
index 0000000..4268d1e
--- /dev/null
+++ b/packages/canvas/src/utils/format.ts
@@ -0,0 +1,6 @@
+/** Format a duration in milliseconds to a human-readable string. */
+export function formatDuration(ms: number | null): string {
+  if (ms == null) return "";
+  if (ms < 1000) return `${ms}ms`;
+  return `${(ms / 1000).toFixed(1)}s`;
+}

From bc81cc520f2f39c612bafed62133900e815cc98a Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 22:05:25 -0700
Subject: [PATCH 4/9] fix(execution): inject graph ID into schema before
 build_graph

The canvas saves schema_json without the top-level `id` field (it's
stored as a separate DB column). But validate_schema requires `id`.
Inject graph.id into the schema dict before calling build_graph and
validate_schema in both the run and validate endpoints.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 packages/execution/app/routes/graphs.py | 8 +++++---
 1 file changed, 5 insertions(+), 3 deletions(-)

diff --git a/packages/execution/app/routes/graphs.py b/packages/execution/app/routes/graphs.py
index 002b3ab..1ea9de7 100644
--- a/packages/execution/app/routes/graphs.py
+++ b/packages/execution/app/routes/graphs.py
@@ -175,10 +175,11 @@ async def validate_graph(
     if graph is None:
         raise HTTPException(status_code=404, detail="Graph not found")
 
+    schema = {**graph.schema_json, "id": graph.id}
     try:
-        validate_schema(graph.schema_json)
+        validate_schema(schema)
         mock = FakeListChatModel(responses=[""])
-        build_graph(graph.schema_json, llm_override=mock)
+        build_graph(schema, llm_override=mock)
     except GraphBuildError as exc:
         return JSONResponse(
             status_code=422,
@@ -297,8 +298,9 @@ async def start_run(
         raise HTTPException(status_code=404, detail="Graph not found")
 
     saver = InMemorySaver()
+    schema = {**graph.schema_json, "id": graph.id}
     try:
-        result = build_graph(graph.schema_json, checkpointer=saver)
+        result = build_graph(schema, checkpointer=saver)
     except GraphBuildError as exc:
         raise HTTPException(status_code=422, detail=str(exc)) from exc
 

From 26b8aac2a2a63b1fa0d09577c8e196086c4661f3 Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 22:07:33 -0700
Subject: [PATCH 5/9] fix(canvas): change LLM default output_key to "messages"

The default state only has a "messages" field. The previous default
"result" caused a 422 from the server because the output_key must
reference an existing state field.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 packages/canvas/src/utils/nodeDefaults.ts | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/packages/canvas/src/utils/nodeDefaults.ts b/packages/canvas/src/utils/nodeDefaults.ts
index 280341b..3fc3def 100644
--- a/packages/canvas/src/utils/nodeDefaults.ts
+++ b/packages/canvas/src/utils/nodeDefaults.ts
@@ -17,7 +17,7 @@ export const NODE_DEFAULTS: Record<string, () => Partial<NodeSchema>> = {
       temperature: 0.7,
       max_tokens: 1024,
       input_map: {},
-      output_key: "result",
+      output_key: "messages",
     },
   }),
   end: () => ({

From 9bdeaae992fb14fe31ee836273d942a09118a45a Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 22:24:36 -0700
Subject: [PATCH 6/9] fix(execution): handle empty input_map in LLM node
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

LLM node: when input_map is empty (default), use messages from state
instead of building an empty HumanMessage. Gemini rejects empty content
with ValueError. Falls back to "Begin." if state messages are also empty.

Also include tracebacks in structured JSON logs — the JSONFormatter
previously discarded exc_info from logger.exception calls.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 packages/execution/app/builder.py | 16 ++++++++++++++--
 packages/execution/app/logging.py | 21 +++++++++++----------
 2 files changed, 25 insertions(+), 12 deletions(-)

diff --git a/packages/execution/app/builder.py b/packages/execution/app/builder.py
index 0556f3d..764adbc 100644
--- a/packages/execution/app/builder.py
+++ b/packages/execution/app/builder.py
@@ -306,8 +306,20 @@ async def llm_node(state: dict) -> dict:
         messages = []
         if config.get("system_prompt"):
             messages.append(SystemMessage(content=config["system_prompt"]))
-        user_content = _format_inputs(inputs)
-        messages.append(HumanMessage(content=user_content))
+
+        if inputs:
+            # Explicit input_map: build a HumanMessage from mapped values
+            user_content = _format_inputs(inputs)
+            messages.append(HumanMessage(content=user_content))
+        else:
+            # No input_map: use messages from state (conversational pattern)
+            state_messages = state.get("messages", [])
+            if state_messages:
+                messages.extend(state_messages)
+            else:
+                # Fallback: send a minimal prompt so the LLM has something
+                messages.append(HumanMessage(content="Begin."))
+
         response = await llm.ainvoke(messages)
         return {config["output_key"]: response.content}
 
diff --git a/packages/execution/app/logging.py b/packages/execution/app/logging.py
index 454f7f3..89a2d77 100644
--- a/packages/execution/app/logging.py
+++ b/packages/execution/app/logging.py
@@ -9,16 +9,17 @@ class JSONFormatter(logging.Formatter):
     """JSON log formatter with run context fields."""
 
     def format(self, record: logging.LogRecord) -> str:
-        return json.dumps(
-            {
-                "ts": self.formatTime(record),
-                "level": record.levelname,
-                "request_id": getattr(record, "request_id", None),
-                "run_id": getattr(record, "run_id", None),
-                "node_id": getattr(record, "node_id", None),
-                "msg": record.getMessage(),
-            }
-        )
+        entry = {
+            "ts": self.formatTime(record),
+            "level": record.levelname,
+            "request_id": getattr(record, "request_id", None),
+            "run_id": getattr(record, "run_id", None),
+            "node_id": getattr(record, "node_id", None),
+            "msg": record.getMessage(),
+        }
+        if record.exc_info and record.exc_info[1] is not None:
+            entry["traceback"] = self.formatException(record.exc_info)
+        return json.dumps(entry)
 
 
 def setup_logging() -> None:

From e406e6ae655b387c1de8cf384d3e380fcd31e0b3 Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 22:32:53 -0700
Subject: [PATCH 7/9] fix(canvas): default LLM node to gemini-2.0-flash

gemini-1.5-flash was retired from the API. Update the default
provider to gemini and model to gemini-2.0-flash.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 packages/canvas/src/utils/nodeDefaults.ts | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/packages/canvas/src/utils/nodeDefaults.ts b/packages/canvas/src/utils/nodeDefaults.ts
index 3fc3def..7721b9a 100644
--- a/packages/canvas/src/utils/nodeDefaults.ts
+++ b/packages/canvas/src/utils/nodeDefaults.ts
@@ -11,8 +11,8 @@ export const NODE_DEFAULTS: Record<string, () => Partial<NodeSchema>> = {
     type: "llm" as const,
     label: "LLM",
     config: {
-      provider: "openai",
-      model: "gpt-4o",
+      provider: "gemini",
+      model: "gemini-2.0-flash",
       system_prompt: "",
       temperature: 0.7,
       max_tokens: 1024,

From 2be51dd8bf54a67bf90fddf364230ccb4382345c Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 22:57:39 -0700
Subject: [PATCH 8/9] fix(canvas): resolve UUIDs to node labels in run panel

Replace raw node IDs with human-readable labels, add timestamps,
show provider/model for LLM nodes, and remove redundant graph_completed row.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 .../src/components/panels/RunEventItem.tsx    | 112 +++++++++++++-----
 .../canvas/src/components/panels/RunPanel.tsx |  33 +++++-
 packages/canvas/src/utils/format.ts           |  12 ++
 3 files changed, 127 insertions(+), 30 deletions(-)

diff --git a/packages/canvas/src/components/panels/RunEventItem.tsx b/packages/canvas/src/components/panels/RunEventItem.tsx
index 61bfd6c..d63cd82 100644
--- a/packages/canvas/src/components/panels/RunEventItem.tsx
+++ b/packages/canvas/src/components/panels/RunEventItem.tsx
@@ -2,56 +2,117 @@ import type { GraphEvent } from "@shared/events";
 import {
   AlertTriangle,
   ArrowRight,
-  CheckCircle,
+  Check,
   Circle,
   Loader,
   Pause,
   Play,
   XCircle,
 } from "lucide-react";
-import { formatDuration } from "../../utils/format";
+import { formatDuration, formatTime } from "../../utils/format";
+
+export interface NodeMapEntry {
+  label: string;
+  type: string;
+  config: Record<string, unknown>;
+}
 
 interface RunEventItemProps {
   event: GraphEvent;
+  /** Set of node IDs that have a node_completed event later in the list */
+  completedNodeIds?: Set<string>;
+  /** Map from node ID to label/type/config */
+  nodeMap?: Map<string, NodeMapEntry>;
+}
+
+function Timestamp({ iso }: { iso?: string }) {
+  const text = formatTime(iso);
+  if (!text) return null;
+  return <span className="ml-auto shrink-0 text-zinc-600">{text}</span>;
+}
+
+function resolveLabel(
+  nodeId: string,
+  nodeMap?: Map<string, NodeMapEntry>,
+): string {
+  return nodeMap?.get(nodeId)?.label ?? nodeId;
 }
 
-export function RunEventItem({ event }: RunEventItemProps) {
+export function RunEventItem({
+  event,
+  completedNodeIds,
+  nodeMap,
+}: RunEventItemProps) {
   switch (event.event) {
     case "run_started":
       return (
         <div className="flex items-center gap-2 text-xs text-blue-400">
           <Play size={12} />
           <span>Run started</span>
+          <Timestamp iso={event.data.timestamp} />
         </div>
       );
 
-    case "node_started":
+    case "node_started": {
+      const done = completedNodeIds?.has(event.data.node_id);
+      if (done) return null;
       return (
         <div className="flex items-center gap-2 text-xs text-amber-400">
           <Loader size={12} className="animate-spin" />
-          <span>{event.data.node_id}</span>
+          <span>{resolveLabel(event.data.node_id, nodeMap)}</span>
+          <Timestamp iso={event.data.timestamp} />
         </div>
       );
+    }
+
+    case "node_completed": {
+      const label = resolveLabel(event.data.node_id, nodeMap);
+      const entry = nodeMap?.get(event.data.node_id);
+      const output = event.data.output as Record<string, unknown> | null;
+      const outputText = output
+        ? Object.values(output)
+            .map((v) => (typeof v === "string" ? v : JSON.stringify(v)))
+            .join("\n")
+        : null;
+
+      const showProviderModel: boolean =
+        entry?.type === "llm" &&
+        Boolean(entry.config.provider) &&
+        Boolean(entry.config.model);
 
-    case "node_completed":
       return (
-        <div className="flex items-center gap-2 text-xs text-green-400">
-          <CheckCircle size={12} />
-          <span>
-            {event.data.node_id}{" "}
-            <span className="text-zinc-500">
-              {formatDuration(event.data.duration_ms)}
+        <div className="flex flex-col gap-1">
+          <div className="flex items-center gap-2 text-xs text-green-400">
+            <Check size={12} />
+            <span>
+              {label}{" "}
+              <span className="text-zinc-500">
+                {formatDuration(event.data.duration_ms)}
+              </span>
             </span>
-          </span>
+          </div>
+          {showProviderModel && entry && (
+            <div className="ml-5 text-xs text-zinc-500">
+              {String(entry.config.provider)} &middot;{" "}
+              {String(entry.config.model)}
+            </div>
+          )}
+          {outputText && (
+            <pre className="ml-5 whitespace-pre-wrap rounded border border-zinc-700 bg-zinc-800 px-2 py-1.5 text-xs text-zinc-300">
+              {outputText}
+            </pre>
+          )}
         </div>
       );
+    }
 
     case "edge_traversed":
       return (
         <div className="flex items-center gap-2 text-xs text-zinc-500">
           <ArrowRight size={12} />
           <span>
-            {event.data.from} → {event.data.to}
+            {resolveLabel(event.data.from, nodeMap)} &rarr;{" "}
+            {resolveLabel(event.data.to, nodeMap)}
           </span>
         </div>
       );
@@ -65,19 +126,12 @@ export function RunEventItem({ event }: RunEventItemProps) {
       );
 
     case "graph_completed":
-      return (
-        <div className="flex items-center gap-2 text-xs text-green-400">
-          <CheckCircle size={12} />
-          <span>
-            Completed{" "}
-            <span className="text-zinc-500">
-              {formatDuration(event.data.duration_ms)}
-            </span>
-          </span>
-        </div>
-      );
+      return null;
 
-    case "error":
+    case "error": {
+      const nodeLabel = event.data.node_id
+        ? resolveLabel(event.data.node_id, nodeMap)
+        : null;
       return (
         <div className="flex items-center gap-2 text-xs text-red-400">
           {event.data.recoverable ? (
@@ -85,9 +139,13 @@ export function RunEventItem({ event }: RunEventItemProps) {
           ) : (
             <XCircle size={12} />
           )}
-          <span>{event.data.message}</span>
+          <span>
+            {nodeLabel ? `${nodeLabel}: ` : ""}
+            {event.data.message}
+          </span>
         </div>
       );
+    }
 
     default:
       return (
diff --git a/packages/canvas/src/components/panels/RunPanel.tsx b/packages/canvas/src/components/panels/RunPanel.tsx
index a9aa640..3c67631 100644
--- a/packages/canvas/src/components/panels/RunPanel.tsx
+++ b/packages/canvas/src/components/panels/RunPanel.tsx
@@ -1,8 +1,10 @@
+import { useGraphStore } from "@store/graphSlice";
 import { useRunStore } from "@store/runSlice";
 import { Sheet } from "@ui/Sheet";
-import { useEffect, useRef, useState } from "react";
+import { useEffect, useMemo, useRef, useState } from "react";
 import { formatDuration } from "../../utils/format";
 import { ResumeForm } from "./ResumeForm";
+import type { NodeMapEntry } from "./RunEventItem";
 import { RunEventItem } from "./RunEventItem";
 
 export function RunPanel() {
@@ -11,6 +13,7 @@ export function RunPanel() {
   const durationMs = useRunStore((s) => s.durationMs);
   const errorMessage = useRunStore((s) => s.errorMessage);
   const pausedPrompt = useRunStore((s) => s.pausedPrompt);
+  const nodes = useGraphStore((s) => s.nodes);
   const [visible, setVisible] = useState(false);
 
   const endRef = useRef<HTMLDivElement>(null);
@@ -30,6 +33,25 @@ export function RunPanel() {
     }
   }, [eventCount]);
 
+  // Build set of node IDs that have completed (to hide their node_started spinner)
+  const completedNodeIds = useMemo(() => {
+    const ids = new Set<string>();
+    for (const e of runOutput) {
+      if (e.event === "node_completed") {
+        ids.add(e.data.node_id);
+      }
+    }
+    return ids;
+  }, [runOutput]);
+
+  const nodeMap = useMemo(() => {
+    const m = new Map<string, NodeMapEntry>();
+    for (const n of nodes) {
+      m.set(n.id, { label: n.label, type: n.type, config: n.config });
+    }
+    return m;
+  }, [nodes]);
+
   if (runStatus === "idle" && !visible) return null;
 
   const title =
@@ -52,8 +74,13 @@ export function RunPanel() {
     >
       <div className="flex flex-col gap-1.5">
         {runOutput.map((event, i) => (
-          // biome-ignore lint/suspicious/noArrayIndexKey: events are append-only, index is stable
-          <RunEventItem key={i} event={event} />
+          <RunEventItem
+            // biome-ignore lint/suspicious/noArrayIndexKey: events are append-only, index is stable
+            key={i}
+            event={event}
+            completedNodeIds={completedNodeIds}
+            nodeMap={nodeMap}
+          />
         ))}
         {runStatus === "error" && errorMessage && (
           <div className="mt-2 rounded border border-red-800 bg-red-950/50 px-3 py-2 text-xs text-red-400">
diff --git a/packages/canvas/src/utils/format.ts b/packages/canvas/src/utils/format.ts
index 4268d1e..81ada25 100644
--- a/packages/canvas/src/utils/format.ts
+++ b/packages/canvas/src/utils/format.ts
@@ -4,3 +4,15 @@ export function formatDuration(ms: number | null): string {
   if (ms < 1000) return `${ms}ms`;
   return `${(ms / 1000).toFixed(1)}s`;
 }
+
+/** Format an ISO timestamp to compact locale time (e.g. "10:30:05 PM"). */
+export function formatTime(isoString: string | undefined): string {
+  if (!isoString) return "";
+  const d = new Date(isoString);
+  if (Number.isNaN(d.getTime())) return "";
+  return d.toLocaleTimeString(undefined, {
+    hour: "numeric",
+    minute: "2-digit",
+    second: "2-digit",
+  });
+}

From 228510bfe647f021e8677c3887b9eac29edeae95 Mon Sep 17 00:00:00 2001
From: prosdev <prosdevlab@gmail.com>
Date: Mon, 16 Mar 2026 23:06:39 -0700
Subject: [PATCH 9/9] fix(canvas): address code review findings for run panel

- Replace recursive reconnection with iterative loop + .catch() safety net
- Fix _handleStreamError type signature (void | Promise<void>)
- Add stale-state guards (terminalReceived/reconnecting) after each await
- Truncate node output display at 2000 chars to prevent DOM bloat
- Reset RunInputDialog state on reopen
- Clear ResumeForm input after submit
- Update gw-frontend skill with Phase 2 patterns and accurate RunSlice shape

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 .claude/gw-plans/canvas/README.md             |   2 +-
 .claude/skills/gw-frontend/SKILL.md           |  33 ++--
 .../src/components/canvas/RunInputDialog.tsx  |  10 +-
 .../src/components/panels/ResumeForm.tsx      |   5 +-
 .../src/components/panels/RunEventItem.tsx    |   8 +-
 packages/canvas/src/store/runSlice.ts         | 148 ++++++++++--------
 6 files changed, 129 insertions(+), 77 deletions(-)

diff --git a/.claude/gw-plans/canvas/README.md b/.claude/gw-plans/canvas/README.md
index 357c1b8..84fb574 100644
--- a/.claude/gw-plans/canvas/README.md
+++ b/.claude/gw-plans/canvas/README.md
@@ -7,7 +7,7 @@ React 19 + React Flow frontend phases. Depends on execution phases 3-4 for API s
 | Phase | Plan | Status |
 |-------|------|--------|
 | 1 | [Canvas core](phase-1-canvas-core/overview.md) -- Home view, Start/LLM/End nodes, edge wiring, config panel, save/load | Complete |
-| 2 | [SSE run panel](phase-2-sse-run-panel/overview.md) -- SSE streaming, run panel, node highlighting, reconnection, resume | Planned |
+| 2 | [SSE run panel](phase-2-sse-run-panel/overview.md) -- SSE streaming, run panel, node highlighting, reconnection, resume | In progress |
 | 3 | Full node set -- Tool/Condition/HumanInput nodes, settings page | Not started |
 | 4 | Validation, run input modal, state panel | Not started |
 | 5 | Error handling, run history, debug panel, JSON schema panel | Not started |
diff --git a/.claude/skills/gw-frontend/SKILL.md b/.claude/skills/gw-frontend/SKILL.md
index da0b63d..78d6402 100644
--- a/.claude/skills/gw-frontend/SKILL.md
+++ b/.claude/skills/gw-frontend/SKILL.md
@@ -57,13 +57,14 @@ packages/canvas/src/
 ├── api/
 │   ├── client.ts     # base fetch wrapper + ApiError class
 │   ├── graphs.ts     # graph CRUD
-│   └── runs.ts       # run start + SSE stream (stub — Phase 2)
+│   └── runs.ts       # run start/cancel/resume + SSE stream
 ├── components/
 │   ├── canvas/       # GraphCanvas, FloatingToolbar, StampGhost, CanvasHint,
-│   │   │               CanvasHeader, SnapConnectionLine, CanvasRoute
+│   │   │               CanvasHeader, SnapConnectionLine, CanvasRoute,
+│   │   │               RunButton, RunInputDialog
 │   │   └── nodes/    # BaseNodeShell, StartNode, LLMNode, EndNode, nodeTypes
 │   ├── home/         # HomeView, GraphCard, NewGraphDialog
-│   ├── panels/       # NodeConfigPanel
+│   ├── panels/       # NodeConfigPanel, RunPanel, RunEventItem, ResumeForm
 │   │   └── config/   # StartNodeConfig, LLMNodeConfig, EndNodeConfig
 │   └── ui/           # Button, Card, Dialog, DropdownMenu, IconButton,
 │                       Input, Select, Sheet, Textarea, Toast, Tooltip
@@ -72,7 +73,7 @@ packages/canvas/src/
 ├── hooks/            # useNodePlacement, useNodeDrop, useBeforeUnload
 ├── store/
 │   ├── graphSlice.ts # graph CRUD, nodes/edges, spliceEdge, save/load
-│   ├── runSlice.ts   # SSE lifecycle (stub — Phase 2)
+│   ├── runSlice.ts   # SSE lifecycle, reconnection, start/cancel/resume
 │   └── uiSlice.ts    # darkMode, panelLayout, lastOpenedGraphId,
 │                       newGraphDialogOpen, toast (message + variant)
 ├── styles/           # tokens.ts (color/spacing design tokens)
@@ -89,13 +90,17 @@ interface RunSlice {
   runStatus: "idle" | "running" | "paused" | "reconnecting"
             | "completed" | "error" | "connection_lost"
   activeNodeId: string | null
-  stateHistory: unknown[]
   runOutput: GraphEvent[]
   reconnectAttempts: number
-  startRun: (input: unknown) => Promise<void>
-  resumeRun: (input: string) => Promise<void>
-  cancelRun: () => void
-  handleConnectionLost: () => void
+  lastEventId: number
+  finalState: unknown | null
+  durationMs: number | null
+  errorMessage: string | null
+  pausedPrompt: string | null
+  startRun: (graphId: string, input?: Record<string, unknown>) => Promise<void>
+  cancelRun: () => Promise<void>
+  resumeRun: (input: unknown) => Promise<void>
+  resetRun: () => void
 }
 
 // uiSlice.ts — UI preferences only, no credentials
@@ -150,6 +155,16 @@ POST /resume                      POST /resume
 POST /resume call returns. The server has a 2-second timeout — if no SSE
 arrives, execution continues anyway (events stored in run history).
 
+## Phase 2 patterns
+
+Patterns from Canvas Phase 2 — follow these in subsequent phases:
+
+- **`NodeMapEntry`** — `RunPanel` builds a `Map<string, { label, type, config }>` from graph nodes and passes it to `RunEventItem` for UUID→label resolution
+- **Iterative reconnection** — `_handleStreamError` uses a for-loop (not recursion) with exponential backoff, wrapped in `.catch()` to guarantee landing in a terminal state
+- **`terminalReceived` guard** — module-level flag set before disconnecting on terminal events, prevents `onerror` → reconnection race after `graph_completed`
+- **Output truncation** — `RunEventItem` caps output display at 2000 chars to prevent DOM bloat from large LLM responses
+- **Dialog state reset** — `RunInputDialog` resets form state via `useEffect` when `open` transitions to `true`
+
 ## Settings panel — read-only, no key input
 
 The settings panel shows provider status only. It never has key input fields.
diff --git a/packages/canvas/src/components/canvas/RunInputDialog.tsx b/packages/canvas/src/components/canvas/RunInputDialog.tsx
index b7fe054..e9e56e3 100644
--- a/packages/canvas/src/components/canvas/RunInputDialog.tsx
+++ b/packages/canvas/src/components/canvas/RunInputDialog.tsx
@@ -1,6 +1,6 @@
 import { Button } from "@ui/Button";
 import { Dialog } from "@ui/Dialog";
-import { useState } from "react";
+import { useEffect, useState } from "react";
 
 interface RunInputDialogProps {
   open: boolean;
@@ -16,6 +16,14 @@ export function RunInputDialog({
   const [value, setValue] = useState("{}");
   const [parseError, setParseError] = useState<string | null>(null);
 
+  // Reset to clean state when dialog opens
+  useEffect(() => {
+    if (open) {
+      setValue("{}");
+      setParseError(null);
+    }
+  }, [open]);
+
   const handleSubmit = () => {
     try {
       const parsed: unknown = JSON.parse(value);
diff --git a/packages/canvas/src/components/panels/ResumeForm.tsx b/packages/canvas/src/components/panels/ResumeForm.tsx
index 4e3ddfe..b2ca9c8 100644
--- a/packages/canvas/src/components/panels/ResumeForm.tsx
+++ b/packages/canvas/src/components/panels/ResumeForm.tsx
@@ -22,7 +22,10 @@ export function ResumeForm({ prompt, onSubmit }: ResumeFormProps) {
         />
         <Button
           variant="primary"
-          onClick={() => onSubmit(value)}
+          onClick={() => {
+            onSubmit(value);
+            setValue("");
+          }}
           disabled={!value.trim()}
         >
           Resume
diff --git a/packages/canvas/src/components/panels/RunEventItem.tsx b/packages/canvas/src/components/panels/RunEventItem.tsx
index d63cd82..a655d2a 100644
--- a/packages/canvas/src/components/panels/RunEventItem.tsx
+++ b/packages/canvas/src/components/panels/RunEventItem.tsx
@@ -11,6 +11,8 @@ import {
 } from "lucide-react";
 import { formatDuration, formatTime } from "../../utils/format";
 
+const MAX_OUTPUT_LENGTH = 2000;
+
 export interface NodeMapEntry {
   label: string;
   type: string;
@@ -69,11 +71,15 @@ export function RunEventItem({
       const label = resolveLabel(event.data.node_id, nodeMap);
       const entry = nodeMap?.get(event.data.node_id);
       const output = event.data.output as Record<string, unknown> | null;
-      const outputText = output
+      const rawOutput = output
         ? Object.values(output)
             .map((v) => (typeof v === "string" ? v : JSON.stringify(v)))
             .join("\n")
         : null;
+      const outputTruncated = rawOutput && rawOutput.length > MAX_OUTPUT_LENGTH;
+      const outputText = outputTruncated
+        ? `${rawOutput.slice(0, MAX_OUTPUT_LENGTH)}…`
+        : rawOutput;
 
       const showProviderModel: boolean =
         entry?.type === "llm" &&
diff --git a/packages/canvas/src/store/runSlice.ts b/packages/canvas/src/store/runSlice.ts
index 3fc10b2..821db47 100644
--- a/packages/canvas/src/store/runSlice.ts
+++ b/packages/canvas/src/store/runSlice.ts
@@ -43,7 +43,7 @@ export interface RunSlice {
   /** @internal — called by SSE event handlers */
   _handleEvent: (event: GraphEvent, eventId: number | null) => void;
   /** @internal — called on SSE connection error */
-  _handleStreamError: (error: Error) => void;
+  _handleStreamError: (error: Error) => void | Promise<void>;
   /** @internal — close the current SSE connection */
   _disconnect: () => void;
 }
@@ -228,7 +228,7 @@ export const useRunStore = create<RunSlice>((set) => ({
     });
   },
 
-  _handleStreamError: async (_error) => {
+  _handleStreamError: (_error) => {
     if (terminalReceived) return;
     if (reconnecting) return;
 
@@ -239,75 +239,95 @@ export const useRunStore = create<RunSlice>((set) => ({
     }
     if (!state.activeRunId) return;
 
-    const attempt = state.reconnectAttempts + 1;
-    if (attempt > MAX_RECONNECT_ATTEMPTS) {
+    const runId = state.activeRunId;
+    reconnecting = true;
+
+    // Iterative reconnection loop with exponential backoff
+    (async () => {
+      for (
+        let attempt = state.reconnectAttempts + 1;
+        attempt <= MAX_RECONNECT_ATTEMPTS;
+        attempt++
+      ) {
+        // Bail if the run was cancelled/reset while we were waiting
+        if (terminalReceived || !reconnecting) return;
+
+        set({ runStatus: "reconnecting", reconnectAttempts: attempt });
+
+        // Exponential backoff: 1s, 2s, 4s
+        await sleep(1000 * 2 ** (attempt - 1));
+
+        // Re-check after sleep — run may have been cancelled/reset
+        if (terminalReceived || !reconnecting) return;
+
+        try {
+          const status = await getRunStatus(runId);
+
+          // Run was cancelled/reset during the fetch
+          if (terminalReceived || !reconnecting) return;
+
+          switch (status.status) {
+            case "completed":
+              reconnecting = false;
+              set({
+                runStatus: "completed",
+                finalState: status.final_state,
+                durationMs: status.duration_ms,
+                activeNodeId: null,
+              });
+              return;
+
+            case "running": {
+              reconnecting = false;
+              const { _handleEvent, _handleStreamError, lastEventId } =
+                useRunStore.getState();
+              cleanup = connectStream(
+                runId,
+                { onEvent: _handleEvent, onError: _handleStreamError },
+                lastEventId,
+              );
+              set({ runStatus: "running", reconnectAttempts: 0 });
+              return;
+            }
+
+            case "paused":
+              reconnecting = false;
+              set({
+                runStatus: "paused",
+                activeNodeId: status.node_id,
+                pausedPrompt: status.prompt,
+              });
+              return;
+
+            case "error":
+              reconnecting = false;
+              set({
+                runStatus: "error",
+                errorMessage: status.error ?? "Run failed on server",
+                activeNodeId: null,
+              });
+              return;
+          }
+        } catch {
+          // Status check failed — continue to next attempt
+        }
+      }
+
+      // All attempts exhausted
       reconnecting = false;
       set({
         runStatus: "connection_lost",
         errorMessage: "Connection lost after 3 attempts",
       });
       showToast("Connection lost — run may still be executing on the server");
-      return;
-    }
-
-    reconnecting = true;
-    set({ runStatus: "reconnecting", reconnectAttempts: attempt });
-
-    // Exponential backoff: 1s, 2s, 4s
-    await sleep(1000 * 2 ** (attempt - 1));
-
-    try {
-      const status = await getRunStatus(state.activeRunId);
-
-      switch (status.status) {
-        case "completed":
-          reconnecting = false;
-          set({
-            runStatus: "completed",
-            finalState: status.final_state,
-            durationMs: status.duration_ms,
-            activeNodeId: null,
-          });
-          break;
-
-        case "running": {
-          reconnecting = false;
-          const { _handleEvent, _handleStreamError, lastEventId } =
-            useRunStore.getState();
-          cleanup = connectStream(
-            state.activeRunId,
-            { onEvent: _handleEvent, onError: _handleStreamError },
-            lastEventId,
-          );
-          set({ runStatus: "running", reconnectAttempts: 0 });
-          break;
-        }
-
-        case "paused":
-          reconnecting = false;
-          set({
-            runStatus: "paused",
-            activeNodeId: status.node_id,
-            pausedPrompt: status.prompt,
-          });
-          break;
-
-        case "error":
-          reconnecting = false;
-          set({
-            runStatus: "error",
-            errorMessage: status.error ?? "Run failed on server",
-            activeNodeId: null,
-          });
-          break;
-      }
-    } catch {
-      // Status check failed — retry
+    })().catch(() => {
+      // Safety net — ensure we always land in a terminal state
       reconnecting = false;
-      useRunStore
-        .getState()
-        ._handleStreamError(new Error("Status check failed"));
-    }
+      set({
+        runStatus: "connection_lost",
+        errorMessage: "Connection lost unexpectedly",
+      });
+    });
   },
 
   _disconnect: () => {