From 90891fd1db166aec0fadb00d590903271920e0d8 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Tue, 19 Aug 2025 17:49:32 -0700
Subject: [PATCH 01/29] add high-level arch for WaveAI feature

---
 aiprompts/waveai-architecture.md | 366 +++++++++++++++++++++++++++++++
 1 file changed, 366 insertions(+)
 create mode 100644 aiprompts/waveai-architecture.md
diff --git a/aiprompts/waveai-architecture.md b/aiprompts/waveai-architecture.md
new file mode 100644
index 0000000000..3e070fe750
--- /dev/null
+++ b/aiprompts/waveai-architecture.md
@@ -0,0 +1,366 @@
+# Wave AI Architecture Documentation
+
+## Overview
+
+Wave AI is a chat-based AI assistant feature integrated into Wave Terminal. It provides a conversational interface for interacting with various AI providers (OpenAI, Anthropic, Perplexity, Google, and Wave's cloud proxy) through a unified streaming architecture. The feature is implemented as a block view within Wave Terminal's modular system.
+
+## Architecture Components
+
+### Frontend Architecture (`frontend/app/view/waveai/`)
+
+#### Core Components
+
+**1. WaveAiModel Class**
+- **Purpose**: Main view model implementing the `ViewModel` interface
+- **Responsibilities**:
+  - State management using Jotai atoms
+  - Configuration management (presets, AI options)
+  - Message handling and persistence
+  - RPC communication with backend
+  - UI state coordination
+
+**2. AiWshClient Class**
+- **Purpose**: Specialized WSH RPC client for AI operations
+- **Extends**: `WshClient`
+- **Responsibilities**:
+  - Handle incoming `aisendmessage` RPC calls
+  - Route messages to the model's `sendMessage` method
+
+**3. React Components**
+- **WaveAi**: Main container component
+- **ChatWindow**: Scrollable message display with auto-scroll behavior
+- **ChatItem**: Individual message renderer with role-based styling
+- **ChatInput**: Auto-resizing textarea with keyboard navigation
+
+#### State Management (Jotai Atoms)
+
+**Message State**:
+```typescript
+messagesAtom: PrimitiveAtom<Array<ChatMessageType>>
+messagesSplitAtom: SplitAtom<Array<ChatMessageType>>
+latestMessageAtom: Atom<ChatMessageType>
+addMessageAtom: WritableAtom<unknown, [message: ChatMessageType], void>
+updateLastMessageAtom: WritableAtom<unknown, [text: string, isUpdating: boolean], void>
+removeLastMessageAtom: WritableAtom<unknown, [], void>
+```
+
+**Configuration State**:
+```typescript
+presetKey: Atom<string>           // Current AI preset selection
+presetMap: Atom<{[k: string]: MetaType}>  // Available AI presets
+mergedPresets: Atom<MetaType>     // Merged configuration hierarchy
+aiOpts: Atom<WaveAIOptsType>      // Final AI options for requests
+```
+
+**UI State**:
+```typescript
+locked: PrimitiveAtom<boolean>    // Prevents input during AI response
+viewIcon: Atom<string>            // Header icon
+viewName: Atom<string>            // Header title
+viewText: Atom<HeaderElem[]>      // Dynamic header elements
+endIconButtons: Atom<IconButtonDecl[]>  // Header action buttons
+```
+
+#### Configuration Hierarchy
+
+The AI configuration follows a three-tier hierarchy (lowest to highest priority):
+1. **Global Settings**: `atoms.settingsAtom["ai:*"]`
+2. **Preset Configuration**: `presets[presetKey]["ai:*"]`
+3. **Block Metadata**: `block.meta["ai:*"]`
+
+Configuration is merged using `mergeMeta()` utility, allowing fine-grained overrides at each level.
+
+#### Data Flow - Frontend
+
+```
+User Input → sendMessage() → 
+├── Add user message to UI
+├── Create WaveAIStreamRequest
+├── Call RpcApi.StreamWaveAiCommand()
+├── Add typing indicator
+└── Stream response handling:
+    ├── Update message incrementally
+    ├── Handle errors
+    └── Save complete conversation
+```
+
+### Backend Architecture (`pkg/waveai/`)
+
+#### Core Interface
+
+**AIBackend Interface**:
+```go
+type AIBackend interface {
+    StreamCompletion(
+        ctx context.Context,
+        request wshrpc.WaveAIStreamRequest,
+    ) chan wshrpc.RespOrErrorUnion[wshrpc.WaveAIPacketType]
+}
+```
+
+#### Backend Implementations
+
+**1. OpenAIBackend** (`openaibackend.go`)
+- **Providers**: OpenAI, Azure OpenAI, Cloudflare Azure
+- **Features**: 
+  - Reasoning model support (o1, o3, o4, gpt-5)
+  - Proxy support
+  - Multiple API types (OpenAI, Azure, AzureAD, CloudflareAzure)
+- **Streaming**: Uses `go-openai` library for SSE streaming
+
+**2. AnthropicBackend** (`anthropicbackend.go`)
+- **Provider**: Anthropic Claude
+- **Features**:
+  - Custom SSE parser for Anthropic's event format
+  - System message handling
+  - Usage token tracking
+- **Events**: `message_start`, `content_block_delta`, `message_stop`, etc.
+
+**3. WaveAICloudBackend** (`cloudbackend.go`)
+- **Provider**: Wave's cloud proxy service
+- **Transport**: WebSocket connection to Wave cloud
+- **Features**: 
+  - Fallback when no API token/baseURL provided
+  - Built-in rate limiting and abuse protection
+
+**4. PerplexityBackend** (`perplexitybackend.go`)
+- **Provider**: Perplexity AI
+- **Implementation**: Similar to OpenAI backend
+
+**5. GoogleBackend** (`googlebackend.go`)
+- **Provider**: Google AI (Gemini)
+- **Implementation**: Custom integration for Google's API
+
+#### Backend Routing Logic
+
+```go
+func RunAICommand(ctx context.Context, request wshrpc.WaveAIStreamRequest) chan wshrpc.RespOrErrorUnion[wshrpc.WaveAIPacketType] {
+    // Route based on request.Opts.APIType:
+    switch request.Opts.APIType {
+    case "anthropic":
+        backend = AnthropicBackend{}
+    case "perplexity":
+        backend = PerplexityBackend{}
+    case "google":
+        backend = GoogleBackend{}
+    default:
+        if IsCloudAIRequest(request.Opts) {
+            backend = WaveAICloudBackend{}
+        } else {
+            backend = OpenAIBackend{}
+        }
+    }
+    return backend.StreamCompletion(ctx, request)
+}
+```
+
+### RPC Communication Layer
+
+#### WSH RPC Integration
+
+**Command**: `streamwaveai`
+**Type**: Response Stream (one request, multiple responses)
+
+**Request Type** (`WaveAIStreamRequest`):
+```go
+type WaveAIStreamRequest struct {
+    ClientId string                    `json:"clientid,omitempty"`
+    Opts     *WaveAIOptsType           `json:"opts"`
+    Prompt   []WaveAIPromptMessageType `json:"prompt"`
+}
+```
+
+**Response Type** (`WaveAIPacketType`):
+```go
+type WaveAIPacketType struct {
+    Type         string           `json:"type"`
+    Model        string           `json:"model,omitempty"`
+    Created      int64            `json:"created,omitempty"`
+    FinishReason string           `json:"finish_reason,omitempty"`
+    Usage        *WaveAIUsageType `json:"usage,omitempty"`
+    Index        int              `json:"index,omitempty"`
+    Text         string           `json:"text,omitempty"`
+    Error        string           `json:"error,omitempty"`
+}
+```
+
+#### Configuration Types
+
+**AI Options** (`WaveAIOptsType`):
+```go
+type WaveAIOptsType struct {
+    Model      string `json:"model"`
+    APIType    string `json:"apitype,omitempty"`
+    APIToken   string `json:"apitoken"`
+    OrgID      string `json:"orgid,omitempty"`
+    APIVersion string `json:"apiversion,omitempty"`
+    BaseURL    string `json:"baseurl,omitempty"`
+    ProxyURL   string `json:"proxyurl,omitempty"`
+    MaxTokens  int    `json:"maxtokens,omitempty"`
+    MaxChoices int    `json:"maxchoices,omitempty"`
+    TimeoutMs  int    `json:"timeoutms,omitempty"`
+}
+```
+
+### Data Persistence
+
+#### Chat History Storage
+
+**Frontend**:
+- **Method**: `fetchWaveFile(blockId, "aidata")`
+- **Format**: JSON array of `WaveAIPromptMessageType`
+- **Sliding Window**: Last 30 messages (`slidingWindowSize = 30`)
+
+**Backend**:
+- **Service**: `BlockService.SaveWaveAiData(blockId, history)`
+- **Storage**: Block-associated file storage
+- **Persistence**: Automatic save after each complete exchange
+
+#### Message Format
+
+**UI Messages** (`ChatMessageType`):
+```typescript
+interface ChatMessageType {
+    id: string;
+    user: string;        // "user" | "assistant" | "error"
+    text: string;
+    isUpdating?: boolean;
+}
+```
+
+**Stored Messages** (`WaveAIPromptMessageType`):
+```go
+type WaveAIPromptMessageType struct {
+    Role    string `json:"role"`     // "user" | "assistant" | "system" | "error"
+    Content string `json:"content"`
+    Name    string `json:"name,omitempty"`
+}
+```
+
+### Error Handling
+
+#### Frontend Error Handling
+
+1. **Network Errors**: Caught in streaming loop, displayed as error messages
+2. **Empty Responses**: Automatically remove typing indicator
+3. **Cancellation**: User can cancel via stop button (`model.cancel = true`)
+4. **Partial Responses**: Saved even if incomplete due to errors
+
+#### Backend Error Handling
+
+1. **Panic Recovery**: All backends use `panichandler.PanicHandler()`
+2. **Context Cancellation**: Proper cleanup on request cancellation
+3. **Provider Errors**: Wrapped and forwarded to frontend
+4. **Connection Errors**: Detailed error messages for debugging
+
+### UI Features
+
+#### Message Rendering
+
+- **Markdown Support**: Full markdown rendering with syntax highlighting
+- **Role-based Styling**: Different colors/layouts for user/assistant/error messages
+- **Typing Indicator**: Animated dots during AI response
+- **Font Configuration**: Configurable font sizes via presets
+
+#### Input Handling
+
+- **Auto-resize**: Textarea grows/shrinks with content (max 5 lines)
+- **Keyboard Navigation**: 
+  - Enter to send
+  - Cmd+L to clear history
+  - Arrow keys for code block selection
+- **Code Block Selection**: Navigate through code blocks in responses
+
+#### Scroll Management
+
+- **Auto-scroll**: Automatically scrolls to new messages
+- **User Scroll Detection**: Pauses auto-scroll when user manually scrolls
+- **Smart Resume**: Resumes auto-scroll when near bottom
+
+### Configuration Management
+
+#### Preset System
+
+**Preset Structure**:
+```json
+{
+  "ai@preset-name": {
+    "display:name": "Preset Display Name",
+    "display:order": 1,
+    "ai:model": "gpt-4",
+    "ai:apitype": "openai",
+    "ai:apitoken": "sk-...",
+    "ai:baseurl": "https://api.openai.com/v1",
+    "ai:maxtokens": 4000,
+    "ai:fontsize": "14px",
+    "ai:fixedfontsize": "12px"
+  }
+}
+```
+
+**Configuration Keys**:
+- `ai:model` - AI model name
+- `ai:apitype` - Provider type (openai, anthropic, perplexity, google)
+- `ai:apitoken` - API authentication token
+- `ai:baseurl` - Custom API endpoint
+- `ai:proxyurl` - HTTP proxy URL
+- `ai:maxtokens` - Maximum response tokens
+- `ai:timeoutms` - Request timeout
+- `ai:fontsize` - UI font size
+- `ai:fixedfontsize` - Code block font size
+
+#### Provider Detection
+
+The UI automatically detects and displays the active provider:
+
+- **Cloud**: Wave's proxy (no token/baseURL)
+- **Local**: localhost/127.0.0.1 endpoints
+- **Remote**: External API endpoints
+- **Provider-specific**: Anthropic, Perplexity with custom icons
+
+### Performance Considerations
+
+#### Frontend Optimizations
+
+- **Jotai Atoms**: Granular reactivity, only re-render affected components
+- **Memo Components**: `ChatWindow` and `ChatItem` are memoized
+- **Throttled Scrolling**: Scroll events throttled to 100ms
+- **Debounced Scroll Detection**: User scroll detection debounced to 300ms
+
+#### Backend Optimizations
+
+- **Streaming**: All responses are streamed for immediate feedback
+- **Context Cancellation**: Proper cleanup prevents resource leaks
+- **Connection Pooling**: HTTP clients reuse connections
+- **Error Recovery**: Graceful degradation on provider failures
+
+### Security Considerations
+
+#### API Token Handling
+
+- **Storage**: Tokens stored in encrypted configuration
+- **Transmission**: Tokens only sent to configured endpoints
+- **Validation**: Backend validates token format and permissions
+
+#### Request Validation
+
+- **Input Sanitization**: User input validated before sending
+- **Rate Limiting**: Cloud backend includes built-in rate limiting
+- **Error Filtering**: Sensitive error details filtered from UI
+
+### Extension Points
+
+#### Adding New Providers
+
+1. **Implement AIBackend Interface**: Create new backend struct
+2. **Add Provider Detection**: Update `RunAICommand()` routing logic
+3. **Add Configuration**: Define provider-specific config keys
+4. **Update UI**: Add provider detection in `viewText` atom
+
+#### Custom Message Types
+
+1. **Extend ChatMessageType**: Add new user types
+2. **Update ChatItem Rendering**: Handle new message types
+3. **Modify Storage**: Update persistence format if needed
+
+This architecture provides a flexible, extensible foundation for AI chat functionality while maintaining clean separation between UI, business logic, and provider integrations.
\ No newline at end of file

From dcfaefa6cdcb6cadf6a9e92c44fceb1811b7ce9e Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Tue, 19 Aug 2025 22:16:26 -0700
Subject: [PATCH 02/29] small fixes

---
 .roo/rules/rules.md | 2 ++
 staticcheck.conf    | 2 +-
 2 files changed, 3 insertions(+), 1 deletion(-)

diff --git a/.roo/rules/rules.md b/.roo/rules/rules.md
index 519bacf82c..c59aae1913 100644
--- a/.roo/rules/rules.md
+++ b/.roo/rules/rules.md
@@ -4,6 +4,8 @@ Wave Terminal is a modern terminal which provides graphical blocks, dynamic layo
 
 It has a TypeScript/React frontend and a Go backend. They talk together over `wshrpc` a custom RPC protocol that is implemented over websocket (and domain sockets).
 
+The frontend uses yarn (berry).
+
 ### Coding Guidelines
 
 - **Go Conventions**:
diff --git a/staticcheck.conf b/staticcheck.conf
index 578e4351d4..6ab1cac1af 100644
--- a/staticcheck.conf
+++ b/staticcheck.conf
@@ -1,2 +1,2 @@
-checks = ["all", "-ST1005", "-QF1003", "-ST1000", "-ST1003"]
+checks = ["all", "-ST1005", "-QF1003", "-ST1000", "-ST1003", "-ST1020"]
 

From 8ad735718e8ca55995b1b16b403953b9cacf8361 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Tue, 19 Aug 2025 22:42:54 -0700
Subject: [PATCH 03/29] fix linter errors

---
 pkg/wcore/workspace.go | 5 +----
 1 file changed, 1 insertion(+), 4 deletions(-)

diff --git a/pkg/wcore/workspace.go b/pkg/wcore/workspace.go
index 5ae340d0fa..d61b2ad7b7 100644
--- a/pkg/wcore/workspace.go
+++ b/pkg/wcore/workspace.go
@@ -128,9 +128,6 @@ func DeleteWorkspace(ctx context.Context, workspaceId string, force bool) (bool,
 		return false, "", fmt.Errorf("error retrieving workspaceList: %w", err)
 	}
 
-	if err != nil {
-		return false, "", fmt.Errorf("error getting workspace: %w", err)
-	}
 	if workspace.Name != "" && workspace.Icon != "" && !force && (len(workspace.TabIds) > 0 || len(workspace.PinnedTabIds) > 0) {
 		log.Printf("Ignoring DeleteWorkspace for workspace %s as it is named\n", workspaceId)
 		return false, "", nil
@@ -231,7 +228,7 @@ func CreateTab(ctx context.Context, workspaceId string, tabName string, activate
 		presetMeta, presetErr := getTabPresetMeta()
 		if presetErr != nil {
 			log.Printf("error getting tab preset meta: %v\n", presetErr)
-		} else if presetMeta != nil && len(presetMeta) > 0 {
+		} else if len(presetMeta) > 0 {
 			tabORef := waveobj.ORefFromWaveObj(tab)
 			wstore.UpdateObjectMeta(ctx, *tabORef, presetMeta, true)
 		}

From 4b87e1b2f1b3918780632f9f846bdb65aa3283f0 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Tue, 19 Aug 2025 22:43:55 -0700
Subject: [PATCH 04/29] checkpoint

---
 aiprompts/usechat-backend-design.md        | 463 ++++++++++++++++
 frontend/app/view/waveai/waveai.tsx        |  24 +-
 frontend/app/view/waveai/waveaiusechat.tsx | 606 +++++++++++++++++++++
 package.json                               |   8 +-
 pkg/waveai/usechat.go                      | 390 +++++++++++++
 pkg/web/web.go                             |  30 +-
 yarn.lock                                  | 142 +++++
 7 files changed, 1657 insertions(+), 6 deletions(-)
 create mode 100644 aiprompts/usechat-backend-design.md
 create mode 100644 frontend/app/view/waveai/waveaiusechat.tsx
 create mode 100644 pkg/waveai/usechat.go

diff --git a/aiprompts/usechat-backend-design.md b/aiprompts/usechat-backend-design.md
new file mode 100644
index 0000000000..f5793718c1
--- /dev/null
+++ b/aiprompts/usechat-backend-design.md
@@ -0,0 +1,463 @@
+# useChat Compatible Backend Design for Wave Terminal
+
+## Overview
+
+This document outlines how to create a `useChat()` compatible backend API using Go and Server-Sent Events (SSE) to replace the current complex RPC-based AI chat system. The goal is to leverage Vercel AI SDK's `useChat()` hook while maintaining all existing AI provider functionality.
+
+## Current vs Target Architecture
+
+### Current Architecture
+```
+Frontend (React) → Custom RPC → Go Backend → AI Providers
+- 10+ Jotai atoms for state management
+- Custom WaveAIStreamRequest/WaveAIPacketType
+- Complex configuration merging in frontend
+- Custom streaming protocol over WebSocket
+```
+
+### Target Architecture
+```
+Frontend (useChat) → HTTP/SSE → Go Backend → AI Providers
+- Single useChat() hook manages all state
+- Standard HTTP POST + SSE streaming
+- Backend-driven configuration resolution
+- Standard AI SDK streaming format
+```
+
+## API Design
+
+### 1. Endpoint Structure
+
+**Chat Streaming Endpoint:**
+```
+POST /api/ai/chat/{blockId}?preset={presetKey}
+```
+
+**Conversation Persistence Endpoints:**
+```
+POST /api/ai/conversations/{blockId}     # Save conversation
+GET  /api/ai/conversations/{blockId}     # Load conversation
+```
+
+**Why this approach:**
+- `blockId`: Identifies the conversation context (existing Wave concept)
+- `preset`: URL parameter for AI configuration preset
+- **Separate persistence**: Clean separation of streaming vs storage
+- **Fast localhost calls**: Frontend can call both endpoints quickly
+- **Simple backend**: Each endpoint has single responsibility
+
+### 2. Request Format & Message Flow
+
+**Simplified Approach:**
+- Frontend manages **entire conversation state** (like all modern chat apps)
+- Frontend sends **complete message history** with each request
+- Backend just processes the messages and streams response
+- Frontend handles persistence via existing Wave file system
+
+**Standard useChat() Request:**
+```json
+{
+  "messages": [
+    {
+      "id": "msg-1",
+      "role": "user",
+      "content": "Hello world"
+    },
+    {
+      "id": "msg-2",
+      "role": "assistant",
+      "content": "Hi there!"
+    },
+    {
+      "id": "msg-3",
+      "role": "user",
+      "content": "How are you?"  // <- NEW message user just typed
+    }
+  ]
+}
+```
+
+**Backend Processing:**
+1. **Receive complete conversation** from frontend
+2. **Resolve AI configuration** (preset, model, etc.)
+3. **Send messages directly** to AI provider
+4. **Stream response** back to frontend
+5. **Frontend calls separate persistence endpoint** when needed
+
+**Optional Extensions:**
+```json
+{
+  "messages": [...],
+  "options": {
+    "temperature": 0.7,
+    "maxTokens": 1000,
+    "model": "gpt-4"  // Override preset model
+  }
+}
+```
+
+### 3. Configuration Resolution
+
+**Priority Order (backend resolves):**
+1. **Request options** (highest priority)
+2. **URL preset parameter** 
+3. **Block metadata** (`block.meta["ai:preset"]`)
+4. **Global settings** (`settings["ai:preset"]`)
+5. **Default preset** (lowest priority)
+
+**Backend Logic:**
+```go
+func resolveAIConfig(blockId, presetKey string, requestOptions map[string]any) (*WaveAIOptsType, error) {
+    // 1. Load block metadata
+    block := getBlock(blockId)
+    blockPreset := block.Meta["ai:preset"]
+    
+    // 2. Load global settings
+    settings := getGlobalSettings()
+    globalPreset := settings["ai:preset"]
+    
+    // 3. Resolve preset hierarchy
+    finalPreset := presetKey
+    if finalPreset == "" {
+        finalPreset = blockPreset
+    }
+    if finalPreset == "" {
+        finalPreset = globalPreset
+    }
+    if finalPreset == "" {
+        finalPreset = "default"
+    }
+    
+    // 4. Load and merge preset config
+    presetConfig := loadPreset(finalPreset)
+    
+    // 5. Apply request overrides
+    return mergeAIConfig(presetConfig, requestOptions), nil
+}
+```
+
+### 4. Response Format (SSE)
+
+**Key Insight: Minimal Conversion**
+Most AI providers (OpenAI, Anthropic) already return SSE streams. Instead of converting to our custom format and back, we can **proxy/transform** their streams directly to useChat format.
+
+**Headers:**
+```
+Content-Type: text/event-stream
+Cache-Control: no-cache
+Connection: keep-alive
+Access-Control-Allow-Origin: *
+```
+
+**useChat Expected Format:**
+```
+data: {"type":"text","text":"Hello"}
+
+data: {"type":"text","text":" world"}
+
+data: {"type":"text","text":"!"}
+
+data: {"type":"finish","finish_reason":"stop","usage":{"prompt_tokens":10,"completion_tokens":3,"total_tokens":13}}
+
+data: [DONE]
+```
+
+**Provider Stream Transformation:**
+- **OpenAI**: Already SSE → direct proxy (no conversion needed)
+- **Anthropic**: Already SSE → direct proxy (minimal field mapping)
+- **Google**: Already streaming → direct proxy
+- **Perplexity**: OpenAI-compatible → direct proxy
+- **Wave Cloud**: WebSocket → **requires conversion** (only one needing transformation)
+
+**Error Format:**
+```
+data: {"type":"error","error":"API key invalid"}
+
+data: [DONE]
+```
+
+## Implementation Plan
+
+### Phase 1: HTTP Handler
+
+```go
+// Simplified approach: Direct provider streaming with minimal transformation
+func (s *WshServer) HandleAIChat(w http.ResponseWriter, r *http.Request) {
+    // 1. Parse URL parameters
+    blockId := mux.Vars(r)["blockId"]
+    presetKey := r.URL.Query().Get("preset")
+    
+    // 2. Parse request body
+    var req struct {
+        Messages []struct {
+            Role    string `json:"role"`
+            Content string `json:"content"`
+        } `json:"messages"`
+        Options map[string]any `json:"options,omitempty"`
+    }
+    json.NewDecoder(r.Body).Decode(&req)
+    
+    // 3. Resolve configuration
+    aiOpts, err := resolveAIConfig(blockId, presetKey, req.Options)
+    if err != nil {
+        http.Error(w, err.Error(), 400)
+        return
+    }
+    
+    // 4. Set SSE headers
+    w.Header().Set("Content-Type", "text/event-stream")
+    w.Header().Set("Cache-Control", "no-cache")
+    w.Header().Set("Connection", "keep-alive")
+    
+    // 5. Route to provider and stream directly
+    switch aiOpts.APIType {
+    case "openai", "perplexity":
+        // Direct proxy - these are already SSE compatible
+        streamDirectSSE(w, r.Context(), aiOpts, req.Messages)
+    case "anthropic":
+        // Direct proxy with minimal field mapping
+        streamAnthropicSSE(w, r.Context(), aiOpts, req.Messages)
+    case "google":
+        // Direct proxy
+        streamGoogleSSE(w, r.Context(), aiOpts, req.Messages)
+    default:
+        // Wave Cloud - only one requiring conversion (WebSocket → SSE)
+        if isCloudAIRequest(aiOpts) {
+            streamWaveCloudToUseChat(w, r.Context(), aiOpts, req.Messages)
+        } else {
+            http.Error(w, "Unsupported provider", 400)
+        }
+    }
+}
+
+// Example: Direct OpenAI streaming (minimal conversion)
+func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *WaveAIOptsType, messages []Message) {
+    client := openai.NewClient(opts.APIToken)
+    
+    stream, err := client.CreateChatCompletionStream(ctx, openai.ChatCompletionRequest{
+        Model:    opts.Model,
+        Messages: convertToOpenAIMessages(messages),
+        Stream:   true,
+    })
+    if err != nil {
+        fmt.Fprintf(w, "data: {\"type\":\"error\",\"error\":%q}\n\n", err.Error())
+        fmt.Fprintf(w, "data: [DONE]\n\n")
+        return
+    }
+    defer stream.Close()
+    
+    for {
+        response, err := stream.Recv()
+        if errors.Is(err, io.EOF) {
+            fmt.Fprintf(w, "data: [DONE]\n\n")
+            return
+        }
+        if err != nil {
+            fmt.Fprintf(w, "data: {\"type\":\"error\",\"error\":%q}\n\n", err.Error())
+            fmt.Fprintf(w, "data: [DONE]\n\n")
+            return
+        }
+        
+        // Direct transformation: OpenAI format → useChat format
+        for _, choice := range response.Choices {
+            if choice.Delta.Content != "" {
+                fmt.Fprintf(w, "data: {\"type\":\"text\",\"text\":%q}\n\n", choice.Delta.Content)
+            }
+            if choice.FinishReason != "" {
+                fmt.Fprintf(w, "data: {\"type\":\"finish\",\"finish_reason\":%q}\n\n", choice.FinishReason)
+            }
+        }
+        
+        w.(http.Flusher).Flush()
+    }
+}
+
+// Wave Cloud conversion (only provider needing transformation)
+func streamWaveCloudToUseChat(w http.ResponseWriter, ctx context.Context, opts *WaveAIOptsType, messages []Message) {
+    // Use existing Wave Cloud WebSocket logic
+    waveReq := wshrpc.WaveAIStreamRequest{
+        Opts:   opts,
+        Prompt: convertMessagesToPrompt(messages),
+    }
+    
+    stream := waveai.RunAICommand(ctx, waveReq) // Returns WebSocket stream
+    
+    // Convert Wave Cloud packets to useChat SSE format
+    for packet := range stream {
+        if packet.Error != nil {
+            fmt.Fprintf(w, "data: {\"type\":\"error\",\"error\":%q}\n\n", packet.Error.Error())
+            break
+        }
+        
+        resp := packet.Response
+        if resp.Text != "" {
+            fmt.Fprintf(w, "data: {\"type\":\"text\",\"text\":%q}\n\n", resp.Text)
+        }
+        if resp.FinishReason != "" {
+            usage := ""
+            if resp.Usage != nil {
+                usage = fmt.Sprintf(",\"usage\":{\"prompt_tokens\":%d,\"completion_tokens\":%d,\"total_tokens\":%d}",
+                    resp.Usage.PromptTokens, resp.Usage.CompletionTokens, resp.Usage.TotalTokens)
+            }
+            fmt.Fprintf(w, "data: {\"type\":\"finish\",\"finish_reason\":%q%s}\n\n", resp.FinishReason, usage)
+        }
+        
+        w.(http.Flusher).Flush()
+    }
+    
+    fmt.Fprintf(w, "data: [DONE]\n\n")
+}
+```
+
+### Phase 2: Frontend Integration
+
+```typescript
+import { useChat } from '@ai-sdk/react';
+
+function WaveAI({ blockId }: { blockId: string }) {
+    // Get current preset from block metadata or settings
+    const preset = useAtomValue(currentPresetAtom);
+    
+    const { messages, input, handleInputChange, handleSubmit, isLoading, error } = useChat({
+        api: `/api/ai/chat/${blockId}?preset=${preset}`,
+        initialMessages: [], // Load from existing aidata file
+        onFinish: (message) => {
+            // Save conversation to aidata file
+            saveConversation(blockId, messages);
+        }
+    });
+    
+    return (
+        <div className="flex flex-col h-full">
+            <div className="flex-1 overflow-y-auto">
+                {messages.map(message => (
+                    <div key={message.id} className={`message ${message.role}`}>
+                        <Markdown text={message.content} />
+                    </div>
+                ))}
+                {isLoading && <TypingIndicator />}
+                {error && <div className="error">{error.message}</div>}
+            </div>
+            
+            <form onSubmit={handleSubmit} className="border-t p-4">
+                <input
+                    value={input}
+                    onChange={handleInputChange}
+                    placeholder="Type a message..."
+                    className="w-full p-2 border rounded"
+                />
+            </form>
+        </div>
+    );
+}
+```
+
+### Phase 3: Advanced Features
+
+#### Multi-modal Support
+```typescript
+// useChat supports multi-modal out of the box
+const { messages, append } = useChat({
+    api: `/api/ai/chat/${blockId}`,
+});
+
+// Send image + text
+await append({
+    role: 'user',
+    content: [
+        { type: 'text', text: 'What do you see in this image?' },
+        { type: 'image', image: imageFile }
+    ]
+});
+```
+
+#### Thinking Models
+```go
+// Backend detects thinking models and formats appropriately
+if isThinkingModel(aiOpts.Model) {
+    // Send thinking content separately
+    fmt.Fprintf(w, "data: {\"type\":\"thinking\",\"text\":%q}\n\n", thinkingText)
+    fmt.Fprintf(w, "data: {\"type\":\"text\",\"text\":%q}\n\n", responseText)
+}
+```
+
+#### Context Injection
+```typescript
+// Add system messages or context via useChat options
+const { messages, append } = useChat({
+    api: `/api/ai/chat/${blockId}`,
+    initialMessages: [
+        {
+            role: 'system',
+            content: 'You are a helpful terminal assistant...'
+        }
+    ]
+});
+```
+
+## Migration Strategy
+
+### 1. Parallel Implementation
+- Keep existing RPC system running
+- Add new HTTP/SSE endpoint alongside
+- Feature flag to switch between systems
+
+### 2. Gradual Migration
+- Start with new blocks using useChat
+- Migrate existing conversations on first interaction
+- Remove RPC system once stable
+
+### 3. Backward Compatibility
+- Existing aidata files work unchanged
+- Same provider backends (OpenAI, Anthropic, etc.)
+- Same configuration system
+
+## Benefits
+
+### Complexity Reduction
+- **Frontend**: ~900 lines → ~100 lines (90% reduction)
+- **State Management**: 10+ atoms → 1 useChat hook
+- **Configuration**: Frontend merging → Backend resolution
+- **Streaming**: Custom protocol → Standard SSE
+
+### Modern Features
+- **Multi-modal**: Images, files, audio support
+- **Thinking Models**: Built-in reasoning trace support
+- **Conversation Management**: Edit, retry, branch conversations
+- **Error Handling**: Automatic retry and error boundaries
+- **Performance**: Optimized streaming and batching
+
+### Developer Experience
+- **Type Safety**: Full TypeScript support
+- **Testing**: Standard HTTP endpoints easier to test
+- **Debugging**: Standard browser dev tools work
+- **Documentation**: Leverage AI SDK docs and community
+
+## Configuration Examples
+
+### URL-based Configuration
+```
+POST /api/ai/chat/block-123?preset=claude-coding
+POST /api/ai/chat/block-456?preset=gpt4-creative
+```
+
+### Header-based Overrides
+```
+POST /api/ai/chat/block-123
+X-AI-Model: gpt-4-turbo
+X-AI-Temperature: 0.8
+```
+
+### Request Body Options
+```json
+{
+  "messages": [...],
+  "options": {
+    "model": "claude-3-sonnet",
+    "temperature": 0.7,
+    "maxTokens": 2000
+  }
+}
+```
+
+This design maintains all existing functionality while dramatically simplifying the implementation and adding modern AI chat capabilities.
\ No newline at end of file
diff --git a/frontend/app/view/waveai/waveai.tsx b/frontend/app/view/waveai/waveai.tsx
index 3c36087cc8..355e1b5aba 100644
--- a/frontend/app/view/waveai/waveai.tsx
+++ b/frontend/app/view/waveai/waveai.tsx
@@ -19,6 +19,7 @@ import { OverlayScrollbarsComponent, OverlayScrollbarsComponentRef } from "overl
 import { forwardRef, memo, useCallback, useEffect, useImperativeHandle, useMemo, useRef, useState } from "react";
 import { debounce, throttle } from "throttle-debounce";
 import "./waveai.scss";
+import { WaveAiUseChat, WaveAiUseChatModel } from "./waveaiusechat";
 
 interface ChatMessageType {
     id: string;
@@ -296,7 +297,15 @@ export class WaveAiModel implements ViewModel {
     }
 
     get viewComponent(): ViewComponent {
-        return WaveAi;
+        // Check if we should use the new useChat implementation
+        const useNewImplementation = this.shouldUseNewImplementation();
+        return useNewImplementation ? WaveAiUseChat : WaveAi;
+    }
+
+    private shouldUseNewImplementation(): boolean {
+        // For now, check for a meta flag to enable the new implementation
+        const blockMeta = globalStore.get(this.blockAtom)?.meta ?? {};
+        return blockMeta["ai:usechat"] === "true" || blockMeta["ai:usechat"] === true;
     }
 
     dispose() {
@@ -685,7 +694,7 @@ const ChatInput = forwardRef<HTMLTextAreaElement, ChatInputProps>(
     }
 );
 
-const WaveAi = ({ model }: { model: WaveAiModel; blockId: string }) => {
+const WaveAiOld = ({ model }: { model: WaveAiModel; blockId: string }) => {
     const { sendMessage } = model.useWaveAi();
     const waveaiRef = useRef<HTMLDivElement>(null);
     const chatWindowRef = useRef<HTMLDivElement>(null);
@@ -879,4 +888,15 @@ const WaveAi = ({ model }: { model: WaveAiModel; blockId: string }) => {
     );
 };
 
+const WaveAi = ({ model, blockId }: { model: WaveAiModel; blockId: string }) => {
+    const useNewImplementation = true;
+
+    if (useNewImplementation) {
+        const useChatModel = useMemo(() => new WaveAiUseChatModel(blockId), [blockId]);
+        return <WaveAiUseChat model={useChatModel} blockId={blockId} />;
+    }
+
+    return <WaveAiOld model={model} blockId={blockId} />;
+};
+
 export { WaveAi };
diff --git a/frontend/app/view/waveai/waveaiusechat.tsx b/frontend/app/view/waveai/waveaiusechat.tsx
new file mode 100644
index 0000000000..4fe9f9ea7e
--- /dev/null
+++ b/frontend/app/view/waveai/waveaiusechat.tsx
@@ -0,0 +1,606 @@
+// Copyright 2025, Command Line Inc.
+// SPDX-License-Identifier: Apache-2.0
+
+import { Button } from "@/app/element/button";
+import { Markdown } from "@/app/element/markdown";
+import { TypingIndicator } from "@/app/element/typingindicator";
+import { atoms, fetchWaveFile, WOS } from "@/store/global";
+import { getWebServerEndpoint } from "@/util/endpoints";
+import { BlockService, ObjectService } from "@/store/services";
+import { checkKeyPressed } from "@/util/keyutil";
+import { fireAndForget, isBlank, mergeMeta } from "@/util/util";
+import { useChat } from "@ai-sdk/react";
+import { DefaultChatTransport } from "ai";
+import { atom, Atom, useAtomValue } from "jotai";
+import { OverlayScrollbarsComponent, OverlayScrollbarsComponentRef } from "overlayscrollbars-react";
+import React, { forwardRef, memo, useCallback, useEffect, useImperativeHandle, useMemo, useRef, useState } from "react";
+import { debounce, throttle } from "throttle-debounce";
+
+interface WaveAiUseChatProps {
+    blockId: string;
+    model: WaveAiUseChatModelImpl;
+}
+
+interface ChatMessage {
+    id: string;
+    role: "user" | "assistant" | "system";
+    content: string;
+}
+
+const slidingWindowSize = 30;
+
+class WaveAiUseChatModelImpl implements ViewModel {
+    viewType: string;
+    blockId: string;
+    blockAtom: Atom<Block>;
+    presetKey: Atom<string>;
+    presetMap: Atom<{ [k: string]: MetaType }>;
+    mergedPresets: Atom<MetaType>;
+    aiOpts: Atom<WaveAIOptsType>;
+    viewIcon?: Atom<string | IconButtonDecl>;
+    viewName?: Atom<string>;
+    viewText?: Atom<string | HeaderElem[]>;
+    endIconButtons?: Atom<IconButtonDecl[]>;
+    textAreaRef: React.RefObject<HTMLTextAreaElement>;
+
+    constructor(blockId: string) {
+        this.viewType = "waveai";
+        this.blockId = blockId;
+        this.blockAtom = WOS.getWaveObjectAtom<Block>(`block:${blockId}`);
+        this.viewIcon = atom("sparkles");
+        this.viewName = atom("Wave AI");
+        this.textAreaRef = React.createRef();
+
+        this.presetKey = atom((get) => {
+            const metaPresetKey = get(this.blockAtom).meta["ai:preset"];
+            const globalPresetKey = get(atoms.settingsAtom)["ai:preset"];
+            return metaPresetKey ?? globalPresetKey;
+        });
+
+        this.presetMap = atom((get) => {
+            const fullConfig = get(atoms.fullConfigAtom);
+            const presets = fullConfig.presets;
+            const settings = fullConfig.settings;
+            return Object.fromEntries(
+                Object.entries(presets)
+                    .filter(([k]) => k.startsWith("ai@"))
+                    .map(([k, v]) => {
+                        const aiPresetKeys = Object.keys(v).filter((k) => k.startsWith("ai:"));
+                        const newV = { ...v };
+                        newV["display:name"] =
+                            aiPresetKeys.length == 1 && aiPresetKeys.includes("ai:*")
+                                ? `${newV["display:name"] ?? "Default"} (${settings["ai:model"]})`
+                                : newV["display:name"];
+                        return [k, newV];
+                    })
+            );
+        });
+
+        this.mergedPresets = atom((get) => {
+            const meta = get(this.blockAtom).meta;
+            let settings = get(atoms.settingsAtom);
+            let presetKey = get(this.presetKey);
+            let presets = get(atoms.fullConfigAtom).presets;
+            let selectedPresets = presets?.[presetKey] ?? {};
+
+            let mergedPresets: MetaType = {};
+            mergedPresets = mergeMeta(settings, selectedPresets, "ai");
+            mergedPresets = mergeMeta(mergedPresets, meta, "ai");
+
+            return mergedPresets;
+        });
+
+        this.aiOpts = atom((get) => {
+            const mergedPresets = get(this.mergedPresets);
+
+            const opts: WaveAIOptsType = {
+                model: mergedPresets["ai:model"] ?? null,
+                apitype: mergedPresets["ai:apitype"] ?? null,
+                orgid: mergedPresets["ai:orgid"] ?? null,
+                apitoken: mergedPresets["ai:apitoken"] ?? null,
+                apiversion: mergedPresets["ai:apiversion"] ?? null,
+                maxtokens: mergedPresets["ai:maxtokens"] ?? null,
+                timeoutms: mergedPresets["ai:timeoutms"] ?? 60000,
+                baseurl: mergedPresets["ai:baseurl"] ?? null,
+                proxyurl: mergedPresets["ai:proxyurl"] ?? null,
+            };
+            return opts;
+        });
+
+        this.viewText = atom((get) => {
+            const viewTextChildren: HeaderElem[] = [];
+            const aiOpts = get(this.aiOpts);
+            const presets = get(this.presetMap);
+            const presetKey = get(this.presetKey);
+            const presetName = presets[presetKey]?.["display:name"] ?? "";
+            const isCloud = isBlank(aiOpts.apitoken) && isBlank(aiOpts.baseurl);
+
+            // Handle known API providers
+            switch (aiOpts?.apitype) {
+                case "anthropic":
+                    viewTextChildren.push({
+                        elemtype: "iconbutton",
+                        icon: "globe",
+                        title: `Using Remote Anthropic API (${aiOpts.model})`,
+                        noAction: true,
+                    });
+                    break;
+                case "perplexity":
+                    viewTextChildren.push({
+                        elemtype: "iconbutton",
+                        icon: "globe",
+                        title: `Using Remote Perplexity API (${aiOpts.model})`,
+                        noAction: true,
+                    });
+                    break;
+                default:
+                    if (isCloud) {
+                        viewTextChildren.push({
+                            elemtype: "iconbutton",
+                            icon: "cloud",
+                            title: "Using Wave's AI Proxy (gpt-4o-mini)",
+                            noAction: true,
+                        });
+                    } else {
+                        const baseUrl = aiOpts.baseurl ?? "OpenAI Default Endpoint";
+                        const modelName = aiOpts.model;
+                        if (baseUrl.startsWith("http://localhost") || baseUrl.startsWith("http://127.0.0.1")) {
+                            viewTextChildren.push({
+                                elemtype: "iconbutton",
+                                icon: "location-dot",
+                                title: `Using Local Model @ ${baseUrl} (${modelName})`,
+                                noAction: true,
+                            });
+                        } else {
+                            viewTextChildren.push({
+                                elemtype: "iconbutton",
+                                icon: "globe",
+                                title: `Using Remote Model @ ${baseUrl} (${modelName})`,
+                                noAction: true,
+                            });
+                        }
+                    }
+            }
+
+            const dropdownItems = Object.entries(presets)
+                .sort((a, b) => ((a[1]["display:order"] ?? 0) > (b[1]["display:order"] ?? 0) ? 1 : -1))
+                .map(
+                    (preset) =>
+                        ({
+                            label: preset[1]["display:name"],
+                            onClick: () =>
+                                fireAndForget(() =>
+                                    ObjectService.UpdateObjectMeta(WOS.makeORef("block", this.blockId), {
+                                        "ai:preset": preset[0],
+                                    })
+                                ),
+                        }) as MenuItem
+                );
+
+            viewTextChildren.push({
+                elemtype: "menubutton",
+                text: presetName,
+                title: "Select AI Configuration",
+                items: dropdownItems,
+            });
+            return viewTextChildren;
+        });
+
+        this.endIconButtons = atom((_) => {
+            let clearButton: IconButtonDecl = {
+                elemtype: "iconbutton",
+                icon: "delete-left",
+                title: "Clear Chat History",
+                click: this.clearMessages.bind(this),
+            };
+            return [clearButton];
+        });
+    }
+
+    get viewComponent(): ViewComponent {
+        return WaveAiUseChat;
+    }
+
+    dispose() {
+        // No cleanup needed for useChat version
+    }
+
+    async populateMessages(): Promise<ChatMessage[]> {
+        const history = await this.fetchAiData();
+        return history.map((msg) => ({
+            id: crypto.randomUUID(),
+            role: msg.role as "user" | "assistant" | "system",
+            content: msg.content,
+        }));
+    }
+
+    async fetchAiData(): Promise<Array<WaveAIPromptMessageType>> {
+        const { data } = await fetchWaveFile(this.blockId, "aidata");
+        if (!data) {
+            return [];
+        }
+        const history: Array<WaveAIPromptMessageType> = JSON.parse(new TextDecoder().decode(data));
+        return history.slice(Math.max(history.length - slidingWindowSize, 0));
+    }
+
+    async saveMessages(messages: ChatMessage[]): Promise<void> {
+        const history: WaveAIPromptMessageType[] = messages.map((msg) => ({
+            role: msg.role,
+            content: msg.content,
+        }));
+        await BlockService.SaveWaveAiData(this.blockId, history);
+    }
+
+    giveFocus(): boolean {
+        if (this?.textAreaRef?.current) {
+            this.textAreaRef.current?.focus();
+            return true;
+        }
+        return false;
+    }
+
+    async clearMessages() {
+        await BlockService.SaveWaveAiData(this.blockId, []);
+    }
+
+    keyDownHandler(waveEvent: WaveKeyboardEvent): boolean {
+        if (checkKeyPressed(waveEvent, "Cmd:l")) {
+            fireAndForget(this.clearMessages.bind(this));
+            return true;
+        }
+        return false;
+    }
+}
+
+const ChatWindow = memo(
+    forwardRef<
+        OverlayScrollbarsComponentRef,
+        { messages: ChatMessage[]; isLoading: boolean; error: Error | null; fontSize?: string; fixedFontSize?: string }
+    >(({ messages, isLoading, error, fontSize, fixedFontSize }, ref) => {
+        const osRef = useRef<OverlayScrollbarsComponentRef>(null);
+        const [userHasScrolled, setUserHasScrolled] = useState(false);
+        const [shouldAutoScroll, setShouldAutoScroll] = useState(true);
+
+        useImperativeHandle(ref, () => osRef.current!, []);
+
+        const scrollToBottom = useCallback(() => {
+            if (osRef.current && shouldAutoScroll) {
+                const viewport = osRef.current.osInstance()?.elements().viewport;
+                if (viewport) {
+                    viewport.scrollTop = viewport.scrollHeight;
+                }
+            }
+        }, [shouldAutoScroll]);
+
+        const handleScroll = useMemo(
+            () =>
+                throttle(100, () => {
+                    if (osRef.current) {
+                        const viewport = osRef.current.osInstance()?.elements().viewport;
+                        if (viewport) {
+                            const { scrollTop, scrollHeight, clientHeight } = viewport;
+                            const isNearBottom = scrollHeight - scrollTop - clientHeight < 100;
+                            setShouldAutoScroll(isNearBottom);
+                            if (!isNearBottom && !userHasScrolled) {
+                                setUserHasScrolled(true);
+                            }
+                        }
+                    }
+                }),
+            [userHasScrolled]
+        );
+
+        const resetUserScroll = useMemo(
+            () =>
+                debounce(300, () => {
+                    setUserHasScrolled(false);
+                }),
+            []
+        );
+
+        useEffect(() => {
+            scrollToBottom();
+        }, [messages, isLoading, scrollToBottom]);
+
+        useEffect(() => {
+            if (shouldAutoScroll && userHasScrolled) {
+                resetUserScroll();
+            }
+        }, [shouldAutoScroll, userHasScrolled, resetUserScroll]);
+
+        return (
+            <div className="flex-1 overflow-hidden">
+                <OverlayScrollbarsComponent
+                    ref={osRef}
+                    className="h-full"
+                    options={{ scrollbars: { autoHide: "leave" } }}
+                    events={{ scroll: handleScroll }}
+                >
+                    <div className="flex flex-col gap-4 p-4">
+                        {messages.map((message) => (
+                            <ChatItem
+                                key={message.id}
+                                message={message}
+                                fontSize={fontSize}
+                                fixedFontSize={fixedFontSize}
+                            />
+                        ))}
+                        {isLoading && (
+                            <div className="flex items-start gap-3">
+                                <div className="flex-shrink-0 w-8 h-8 bg-accent/10 rounded-md flex items-center justify-center">
+                                    <i className="fa-sharp fa-solid fa-sparkles text-accent"></i>
+                                </div>
+                                <TypingIndicator className="mt-1" />
+                            </div>
+                        )}
+                        {error && (
+                            <div className="flex items-start gap-3">
+                                <div className="flex-shrink-0 w-8 h-8 bg-red-100 rounded-md flex items-center justify-center">
+                                    <i className="fa-sharp fa-solid fa-circle-exclamation text-red-600"></i>
+                                </div>
+                                <div className="flex-1 bg-red-50 border border-red-200 rounded-lg p-3 max-w-[85%]">
+                                    <div className="text-red-800 text-sm">
+                                        <strong>Error:</strong> {error.message}
+                                    </div>
+                                </div>
+                            </div>
+                        )}
+                    </div>
+                </OverlayScrollbarsComponent>
+            </div>
+        );
+    })
+);
+ChatWindow.displayName = "ChatWindow";
+
+const ChatItem = memo(
+    ({ message, fontSize, fixedFontSize }: { message: ChatMessage; fontSize?: string; fixedFontSize?: string }) => {
+        const { role, content } = message;
+
+        if (role === "user") {
+            return (
+                <div className="flex items-start gap-3 justify-end">
+                    <div className="bg-accent/15 rounded-lg p-3 max-w-[85%] ml-auto">
+                        <Markdown
+                            text={content}
+                            scrollable={false}
+                            fontSizeOverride={fontSize ? parseInt(fontSize) : undefined}
+                            fixedFontSizeOverride={fixedFontSize ? parseInt(fixedFontSize) : undefined}
+                        />
+                    </div>
+                    <div className="flex-shrink-0 w-8 h-8 bg-accent/10 rounded-md flex items-center justify-center">
+                        <i className="fa-sharp fa-solid fa-user text-accent"></i>
+                    </div>
+                </div>
+            );
+        }
+
+        if (role === "assistant") {
+            return (
+                <div className="flex items-start gap-3">
+                    <div className="flex-shrink-0 w-8 h-8 bg-accent/10 rounded-md flex items-center justify-center">
+                        <i className="fa-sharp fa-solid fa-sparkles text-accent"></i>
+                    </div>
+                    <div className="bg-secondary/10 rounded-lg p-3 max-w-[85%]">
+                        <Markdown
+                            text={content}
+                            scrollable={false}
+                            fontSizeOverride={fontSize ? parseInt(fontSize) : undefined}
+                            fixedFontSizeOverride={fixedFontSize ? parseInt(fixedFontSize) : undefined}
+                        />
+                    </div>
+                </div>
+            );
+        }
+
+        return null;
+    }
+);
+ChatItem.displayName = "ChatItem";
+
+const ChatInput = memo(
+    ({
+        input,
+        handleInputChange,
+        handleSubmit,
+        isLoading,
+        textAreaRef,
+    }: {
+        input: string;
+        handleInputChange: (e: React.ChangeEvent<HTMLTextAreaElement>) => void;
+        handleSubmit: (e: React.FormEvent) => void;
+        isLoading: boolean;
+        textAreaRef: React.RefObject<HTMLTextAreaElement>;
+    }) => {
+        const [textAreaHeight, setTextAreaHeight] = useState(25);
+        const maxLines = 5;
+        const lineHeight = 17;
+        const minHeight = 25;
+        const maxHeight = minHeight + (maxLines - 1) * lineHeight;
+
+        const adjustTextAreaHeight = useCallback(() => {
+            if (textAreaRef.current) {
+                const textArea = textAreaRef.current;
+                textArea.style.height = `${minHeight}px`;
+                const scrollHeight = textArea.scrollHeight;
+                const newHeight = Math.min(Math.max(scrollHeight, minHeight), maxHeight);
+                setTextAreaHeight(newHeight);
+                textArea.style.height = `${newHeight}px`;
+            }
+        }, [textAreaRef, minHeight, maxHeight]);
+
+        useEffect(() => {
+            adjustTextAreaHeight();
+        }, [input, adjustTextAreaHeight]);
+
+        const handleKeyDown = useCallback(
+            (event: React.KeyboardEvent<HTMLTextAreaElement>) => {
+                if (event.key === "Enter" && !event.shiftKey) {
+                    event.preventDefault();
+                    handleSubmit(event as any);
+                    return;
+                }
+            },
+            [handleSubmit]
+        );
+
+        return (
+            <div className="flex-shrink-0 p-4 border-t border-border">
+                <form onSubmit={handleSubmit} className="flex items-end gap-3">
+                    <div className="flex-1 relative">
+                        <textarea
+                            ref={textAreaRef}
+                            value={input}
+                            onChange={handleInputChange}
+                            onKeyDown={handleKeyDown}
+                            placeholder="Ask Wave AI anything..."
+                            className="w-full resize-none rounded-lg border border-border bg-background px-3 py-2 text-sm placeholder:text-muted-foreground focus:outline-none focus:ring-2 focus:ring-accent focus:border-transparent disabled:opacity-50"
+                            style={{ height: `${textAreaHeight}px` }}
+                            disabled={isLoading}
+                        />
+                    </div>
+                    <Button
+                        type="submit"
+                        disabled={isLoading || !input.trim()}
+                        className="solid green h-10 w-10 rounded-lg p-0 flex items-center justify-center"
+                    >
+                        <i className="fa-sharp fa-solid fa-paper-plane-top text-sm" />
+                    </Button>
+                </form>
+            </div>
+        );
+    }
+);
+ChatInput.displayName = "ChatInput";
+
+const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
+    const presetKey = useAtomValue(model.presetKey);
+    const fontSize = useAtomValue(model.mergedPresets)?.["ai:fontsize"];
+    const fixedFontSize = useAtomValue(model.mergedPresets)?.["ai:fixedfontsize"];
+    const [initialMessages, setInitialMessages] = useState<ChatMessage[]>([]);
+    const [isInitialized, setIsInitialized] = useState(false);
+
+    // Load initial messages
+    useEffect(() => {
+        const loadMessages = async () => {
+            try {
+                const messages = await model.populateMessages();
+                setInitialMessages(messages);
+                setIsInitialized(true);
+            } catch (error) {
+                console.error("Failed to load initial messages:", error);
+                setIsInitialized(true);
+            }
+        };
+        loadMessages();
+    }, [model]);
+
+    const [input, setInput] = useState("");
+    const { messages, sendMessage, status, error, setMessages, stop } = useChat({
+        id: `chat-${blockId}`,
+        messages: initialMessages.map(m => ({
+            id: m.id,
+            role: m.role,
+            parts: [{ type: 'text', text: m.content }]
+        })),
+        transport: new DefaultChatTransport({
+            api: `${getWebServerEndpoint()}/api/aichat?blockid=${blockId}&preset=${encodeURIComponent(presetKey)}`,
+            body: () => ({
+                blockId,
+                preset: presetKey
+            }),
+            headers: async () => ({
+                "X-Block-ID": blockId,
+            }),
+            prepareSendMessagesRequest: ({ id, messages, trigger, messageId }) => ({
+                headers: { "X-Session-ID": id },
+                body: {
+                    messages: messages.slice(-30), // Keep last 30 messages
+                    trigger,
+                    messageId,
+                },
+            }),
+            credentials: "include",
+        }),
+        onFinish: async ({ message }) => {
+            // Save conversation after each completion
+            try {
+                const allMessages = [...messages, message];
+                const chatMessages = allMessages.map(m => ({
+                    id: m.id,
+                    role: m.role as "user" | "assistant" | "system",
+                    content: m.parts.map(p => p.type === 'text' ? p.text : '').join('')
+                }));
+                await model.saveMessages(chatMessages);
+            } catch (error) {
+                console.error("Failed to save messages:", error);
+            }
+        },
+        onError: (error) => {
+            console.error("Chat error:", error);
+        },
+    });
+
+    const isLoading = status === "streaming" || status === "submitted";
+
+    const handleInputChange = useCallback((e: React.ChangeEvent<HTMLTextAreaElement>) => {
+        setInput(e.target.value);
+    }, []);
+
+    const handleSubmit = useCallback((e: React.FormEvent) => {
+        e.preventDefault();
+        if (!input.trim() || isLoading) return;
+        
+        sendMessage({ text: input });
+        setInput("");
+    }, [input, isLoading, sendMessage]);
+
+    // Clear messages handler
+    const handleClearMessages = useCallback(async () => {
+        try {
+            await model.clearMessages();
+            setMessages([]);
+        } catch (error) {
+            console.error("Failed to clear messages:", error);
+        }
+    }, [model, setMessages]);
+
+    // Update model's clear method to use our handler
+    useEffect(() => {
+        model.clearMessages = handleClearMessages;
+    }, [model, handleClearMessages]);
+
+    if (!isInitialized) {
+        return (
+            <div className="flex items-center justify-center h-full">
+                <div className="text-muted-foreground">Loading...</div>
+            </div>
+        );
+    }
+
+    return (
+        <div className="flex flex-col h-full w-full bg-background">
+            <ChatWindow
+                messages={messages.map(m => ({
+                    id: m.id,
+                    role: m.role as "user" | "assistant" | "system",
+                    content: m.parts.map(p => p.type === 'text' ? p.text : '').join('')
+                }))}
+                isLoading={isLoading}
+                error={error}
+                fontSize={fontSize}
+                fixedFontSize={fixedFontSize}
+            />
+            <ChatInput
+                input={input}
+                handleInputChange={handleInputChange}
+                handleSubmit={handleSubmit}
+                isLoading={isLoading}
+                textAreaRef={model.textAreaRef}
+            />
+        </div>
+    );
+};
+
+export { WaveAiUseChat };
+export const WaveAiUseChatModel = WaveAiUseChatModelImpl;
diff --git a/package.json b/package.json
index 55758a7481..7ba0673843 100644
--- a/package.json
+++ b/package.json
@@ -92,6 +92,7 @@
         "vitest": "^3.0.9"
     },
     "dependencies": {
+        "@ai-sdk/react": "^2.0.18",
         "@floating-ui/react": "^0.27.15",
         "@monaco-editor/loader": "^1.4.0",
         "@monaco-editor/react": "^4.6.0",
@@ -108,6 +109,7 @@
         "@xterm/addon-web-links": "^0.11.0",
         "@xterm/addon-webgl": "^0.18.0",
         "@xterm/xterm": "^5.5.0",
+        "ai": "^5.0.18",
         "base64-js": "^1.5.1",
         "class-variance-authority": "^0.7.1",
         "clsx": "^2.1.1",
@@ -157,7 +159,8 @@
         "use-device-pixel-ratio": "^1.1.2",
         "winston": "^3.17.0",
         "ws": "^8.18.3",
-        "yaml": "^2.7.1"
+        "yaml": "^2.7.1",
+        "zod": "^4.0.17"
     },
     "resolutions": {
         "send@npm:0.18.0": "0.19.0",
@@ -167,7 +170,8 @@
         "esbuild@npm:^0.18.0 || ^0.19.0 || ^0.20.0 || ^0.21.0 || ^0.22.0 || ^0.23.0 || ^0.24.0": "^0.25",
         "esbuild@npm:^0.21.5": "^0.25",
         "esbuild@npm:~0.23.0": "^0.25",
-        "node-abi": "^4.6.0"
+        "node-abi": "^4.6.0",
+        "zod": "^4.0.17"
     },
     "packageManager": "yarn@4.6.0",
     "workspaces": [
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
new file mode 100644
index 0000000000..1871ca7c38
--- /dev/null
+++ b/pkg/waveai/usechat.go
@@ -0,0 +1,390 @@
+// Copyright 2025, Command Line Inc.
+// SPDX-License-Identifier: Apache-2.0
+
+package waveai
+
+import (
+	"context"
+	"encoding/json"
+	"fmt"
+	"io"
+	"net/http"
+
+	openaiapi "github.com/sashabaranov/go-openai"
+	"github.com/wavetermdev/waveterm/pkg/waveobj"
+	"github.com/wavetermdev/waveterm/pkg/wconfig"
+	"github.com/wavetermdev/waveterm/pkg/wshrpc"
+	"github.com/wavetermdev/waveterm/pkg/wstore"
+)
+
+const (
+	UseChatContentTypeSSE = "text/event-stream"
+	UseChatCacheControl   = "no-cache"
+	UseChatConnection     = "keep-alive"
+)
+
+type UseChatMessage struct {
+	Role    string `json:"role"`
+	Content string `json:"content"`
+}
+
+type UseChatRequest struct {
+	Messages []UseChatMessage `json:"messages"`
+	Options  map[string]any   `json:"options,omitempty"`
+}
+
+type UseChatTextResponse struct {
+	Type string `json:"type"`
+	Text string `json:"text"`
+}
+
+type UseChatFinishResponse struct {
+	Type         string                `json:"type"`
+	FinishReason string                `json:"finish_reason"`
+	Usage        *UseChatUsageResponse `json:"usage,omitempty"`
+}
+
+type UseChatUsageResponse struct {
+	PromptTokens     int `json:"prompt_tokens"`
+	CompletionTokens int `json:"completion_tokens"`
+	TotalTokens      int `json:"total_tokens"`
+}
+
+type UseChatErrorResponse struct {
+	Type  string `json:"type"`
+	Error string `json:"error"`
+}
+
+func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOptions map[string]any) (*wshrpc.WaveAIOptsType, error) {
+	// Get block metadata
+	block, err := wstore.DBMustGet[*waveobj.Block](ctx, blockId)
+	if err != nil {
+		return nil, fmt.Errorf("failed to get block: %v", err)
+	}
+
+	// Get global settings
+	fullConfig := wconfig.GetWatcher().GetFullConfig()
+
+	// Resolve preset hierarchy
+	finalPreset := presetKey
+	if finalPreset == "" && block != nil && block.Meta != nil {
+		if blockPreset, ok := block.Meta["ai:preset"].(string); ok {
+			finalPreset = blockPreset
+		}
+	}
+	if finalPreset == "" {
+		if globalPreset := fullConfig.Settings.AiPreset; globalPreset != "" {
+			finalPreset = globalPreset
+		}
+	}
+	if finalPreset == "" {
+		finalPreset = "default"
+	}
+
+	// Load preset configuration
+	var presetConfig map[string]any
+	if finalPreset != "default" {
+		if preset, ok := fullConfig.Presets[fmt.Sprintf("ai@%s", finalPreset)]; ok {
+			presetConfig = preset
+		}
+	}
+
+	// Build AI options with hierarchy: global < preset < block < request
+	aiOpts := &wshrpc.WaveAIOptsType{}
+
+	// Helper function to get string value from hierarchy
+	getString := func(key string) string {
+		// Request options (highest priority)
+		if val, ok := requestOptions[key]; ok {
+			if str, ok := val.(string); ok {
+				return str
+			}
+		}
+		// Block metadata
+		if block != nil && block.Meta != nil {
+			if val, ok := block.Meta[key]; ok {
+				if str, ok := val.(string); ok {
+					return str
+				}
+			}
+		}
+		// Preset config
+		if presetConfig != nil {
+			if val, ok := presetConfig[key]; ok {
+				if str, ok := val.(string); ok {
+					return str
+				}
+			}
+		}
+		// Global settings - use struct fields
+		switch key {
+		case "ai:preset":
+			return fullConfig.Settings.AiPreset
+		case "ai:apitype":
+			return fullConfig.Settings.AiApiType
+		case "ai:apitoken":
+			return fullConfig.Settings.AiApiToken
+		case "ai:baseurl":
+			return fullConfig.Settings.AiBaseURL
+		case "ai:model":
+			return fullConfig.Settings.AiModel
+		case "ai:orgid":
+			return fullConfig.Settings.AiOrgID
+		case "ai:apiversion":
+			return fullConfig.Settings.AIApiVersion
+		case "ai:proxyurl":
+			return fullConfig.Settings.AiProxyUrl
+		}
+		return ""
+	}
+
+	// Helper function to get int value from hierarchy
+	getInt := func(key string) int {
+		// Request options (highest priority)
+		if val, ok := requestOptions[key]; ok {
+			if num, ok := val.(float64); ok {
+				return int(num)
+			}
+			if num, ok := val.(int); ok {
+				return num
+			}
+		}
+		// Block metadata
+		if block != nil && block.Meta != nil {
+			if val, ok := block.Meta[key]; ok {
+				if num, ok := val.(float64); ok {
+					return int(num)
+				}
+				if num, ok := val.(int); ok {
+					return num
+				}
+			}
+		}
+		// Preset config
+		if presetConfig != nil {
+			if val, ok := presetConfig[key]; ok {
+				if num, ok := val.(float64); ok {
+					return int(num)
+				}
+				if num, ok := val.(int); ok {
+					return num
+				}
+			}
+		}
+		// Global settings - use struct fields
+		switch key {
+		case "ai:maxtokens":
+			return int(fullConfig.Settings.AiMaxTokens)
+		case "ai:timeoutms":
+			return int(fullConfig.Settings.AiTimeoutMs)
+		}
+		return 0
+	}
+
+	// Populate AI options
+	aiOpts.Model = getString("ai:model")
+	aiOpts.APIType = getString("ai:apitype")
+	aiOpts.APIToken = getString("ai:apitoken")
+	aiOpts.BaseURL = getString("ai:baseurl")
+	aiOpts.OrgID = getString("ai:orgid")
+	aiOpts.APIVersion = getString("ai:apiversion")
+	aiOpts.ProxyURL = getString("ai:proxyurl")
+	aiOpts.MaxTokens = getInt("ai:maxtokens")
+	aiOpts.MaxChoices = getInt("ai:maxchoices")
+	aiOpts.TimeoutMs = getInt("ai:timeoutms")
+
+	// Set defaults
+	if aiOpts.Model == "" {
+		aiOpts.Model = "gpt-4"
+	}
+	if aiOpts.APIType == "" {
+		aiOpts.APIType = APIType_OpenAI
+	}
+	if aiOpts.MaxTokens == 0 {
+		aiOpts.MaxTokens = 4000
+	}
+
+	return aiOpts, nil
+}
+
+func convertUseChatMessagesToPrompt(messages []UseChatMessage) []wshrpc.WaveAIPromptMessageType {
+	var prompt []wshrpc.WaveAIPromptMessageType
+	for _, msg := range messages {
+		prompt = append(prompt, wshrpc.WaveAIPromptMessageType{
+			Role:    msg.Role,
+			Content: msg.Content,
+		})
+	}
+	return prompt
+}
+
+func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+	// Set up OpenAI client
+	clientConfig := openaiapi.DefaultConfig(opts.APIToken)
+	if opts.BaseURL != "" {
+		clientConfig.BaseURL = opts.BaseURL
+	}
+	if opts.OrgID != "" {
+		clientConfig.OrgID = opts.OrgID
+	}
+	if opts.APIVersion != "" {
+		clientConfig.APIVersion = opts.APIVersion
+	}
+
+	client := openaiapi.NewClientWithConfig(clientConfig)
+
+	// Convert messages
+	var openaiMessages []openaiapi.ChatCompletionMessage
+	for _, msg := range messages {
+		openaiMessages = append(openaiMessages, openaiapi.ChatCompletionMessage{
+			Role:    msg.Role,
+			Content: msg.Content,
+		})
+	}
+
+	// Create request
+	req := openaiapi.ChatCompletionRequest{
+		Model:    opts.Model,
+		Messages: openaiMessages,
+		Stream:   true,
+	}
+
+	if opts.MaxTokens > 0 {
+		if isReasoningModel(opts.Model) {
+			req.MaxCompletionTokens = opts.MaxTokens
+		} else {
+			req.MaxTokens = opts.MaxTokens
+		}
+	}
+
+	// Create stream
+	stream, err := client.CreateChatCompletionStream(ctx, req)
+	if err != nil {
+		writeUseChatError(w, fmt.Sprintf("OpenAI API error: %v", err))
+		return
+	}
+	defer stream.Close()
+
+	// Stream responses
+	for {
+		response, err := stream.Recv()
+		if err == io.EOF {
+			writeUseChatDone(w)
+			return
+		}
+		if err != nil {
+			writeUseChatError(w, fmt.Sprintf("Stream error: %v", err))
+			return
+		}
+
+		// Process choices
+		for _, choice := range response.Choices {
+			if choice.Delta.Content != "" {
+				writeUseChatText(w, choice.Delta.Content)
+			}
+			if choice.FinishReason != "" {
+				usage := &UseChatUsageResponse{}
+				if response.Usage.PromptTokens > 0 {
+					usage.PromptTokens = response.Usage.PromptTokens
+					usage.CompletionTokens = response.Usage.CompletionTokens
+					usage.TotalTokens = response.Usage.TotalTokens
+				}
+				writeUseChatFinish(w, string(choice.FinishReason), usage)
+			}
+		}
+
+		// Flush the response
+		if flusher, ok := w.(http.Flusher); ok {
+			flusher.Flush()
+		}
+	}
+}
+
+func writeUseChatText(w http.ResponseWriter, text string) {
+	resp := UseChatTextResponse{
+		Type: "text",
+		Text: text,
+	}
+	data, _ := json.Marshal(resp)
+	fmt.Fprintf(w, "data: %s\n\n", data)
+}
+
+func writeUseChatFinish(w http.ResponseWriter, finishReason string, usage *UseChatUsageResponse) {
+	resp := UseChatFinishResponse{
+		Type:         "finish",
+		FinishReason: finishReason,
+		Usage:        usage,
+	}
+	data, _ := json.Marshal(resp)
+	fmt.Fprintf(w, "data: %s\n\n", data)
+}
+
+func writeUseChatError(w http.ResponseWriter, errorMsg string) {
+	resp := UseChatErrorResponse{
+		Type:  "error",
+		Error: errorMsg,
+	}
+	data, _ := json.Marshal(resp)
+	fmt.Fprintf(w, "data: %s\n\n", data)
+	writeUseChatDone(w)
+}
+
+func writeUseChatDone(w http.ResponseWriter) {
+	fmt.Fprintf(w, "data: [DONE]\n\n")
+}
+
+func HandleAIChat(w http.ResponseWriter, r *http.Request) {
+	// Handle CORS preflight requests
+	if r.Method == http.MethodOptions {
+		w.WriteHeader(http.StatusOK)
+		return
+	}
+
+	// Parse query parameters
+	blockId := r.URL.Query().Get("blockid")
+	presetKey := r.URL.Query().Get("preset")
+
+	if blockId == "" {
+		http.Error(w, "blockid query parameter is required", http.StatusBadRequest)
+		return
+	}
+
+	// Parse request body
+	var req UseChatRequest
+	if err := json.NewDecoder(r.Body).Decode(&req); err != nil {
+		http.Error(w, fmt.Sprintf("Invalid request body: %v", err), http.StatusBadRequest)
+		return
+	}
+
+	// Resolve AI configuration
+	aiOpts, err := resolveAIConfig(r.Context(), blockId, presetKey, req.Options)
+	if err != nil {
+		http.Error(w, fmt.Sprintf("Configuration error: %v", err), http.StatusBadRequest)
+		return
+	}
+
+	// Validate configuration
+	if aiOpts.Model == "" {
+		http.Error(w, "No AI model specified", http.StatusBadRequest)
+		return
+	}
+
+	// For now, only support OpenAI
+	if aiOpts.APIType != APIType_OpenAI && aiOpts.APIType != "" {
+		http.Error(w, fmt.Sprintf("Unsupported API type: %s (only OpenAI supported in POC)", aiOpts.APIType), http.StatusBadRequest)
+		return
+	}
+
+	if aiOpts.APIToken == "" {
+		http.Error(w, "No API token provided", http.StatusBadRequest)
+		return
+	}
+
+	// Set SSE headers
+	w.Header().Set("Content-Type", UseChatContentTypeSSE)
+	w.Header().Set("Cache-Control", UseChatCacheControl)
+	w.Header().Set("Connection", UseChatConnection)
+
+	// Stream OpenAI response
+	streamOpenAIToUseChat(w, r.Context(), aiOpts, req.Messages)
+}
diff --git a/pkg/web/web.go b/pkg/web/web.go
index 8a3e6470b4..0a488b517e 100644
--- a/pkg/web/web.go
+++ b/pkg/web/web.go
@@ -19,7 +19,6 @@ import (
 	"time"
 
 	"github.com/google/uuid"
-	"github.com/gorilla/handlers"
 	"github.com/gorilla/mux"
 	"github.com/wavetermdev/waveterm/pkg/authkey"
 	"github.com/wavetermdev/waveterm/pkg/docsite"
@@ -29,6 +28,7 @@ import (
 	"github.com/wavetermdev/waveterm/pkg/schema"
 	"github.com/wavetermdev/waveterm/pkg/service"
 	"github.com/wavetermdev/waveterm/pkg/util/utilfn"
+	"github.com/wavetermdev/waveterm/pkg/waveai"
 	"github.com/wavetermdev/waveterm/pkg/wavebase"
 	"github.com/wavetermdev/waveterm/pkg/wshrpc"
 	"github.com/wavetermdev/waveterm/pkg/wshrpc/wshclient"
@@ -404,6 +404,13 @@ func WebFnWrap(opts WebFnOpts, fn WebFnType) WebFnType {
 			w.Header().Set(CacheControlHeaderKey, CacheControlHeaderNoCache)
 		}
 		w.Header().Set("Access-Control-Expose-Headers", "X-ZoneFileInfo")
+
+		// Handle CORS preflight OPTIONS requests without auth validation
+		if r.Method == http.MethodOptions {
+			w.WriteHeader(http.StatusOK)
+			return
+		}
+
 		err := authkey.ValidateIncomingRequest(r)
 		if err != nil {
 			w.WriteHeader(http.StatusUnauthorized)
@@ -447,12 +454,31 @@ func RunWebServer(listener net.Listener) {
 	gr.PathPrefix("/wave/stream-file/").HandlerFunc(WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamFile))
 	gr.HandleFunc("/wave/file", WebFnWrap(WebFnOpts{AllowCaching: false}, handleWaveFile))
 	gr.HandleFunc("/wave/service", WebFnWrap(WebFnOpts{JsonErrors: true}, handleService))
+	gr.HandleFunc("/api/aichat", WebFnWrap(WebFnOpts{AllowCaching: false}, waveai.HandleAIChat))
 	gr.HandleFunc("/vdom/{uuid}/{path:.*}", WebFnWrap(WebFnOpts{AllowCaching: true}, handleVDom))
 	gr.PathPrefix(docsitePrefix).Handler(http.StripPrefix(docsitePrefix, docsite.GetDocsiteHandler()))
 	gr.PathPrefix(schemaPrefix).Handler(http.StripPrefix(schemaPrefix, schema.GetSchemaHandler()))
+
 	handler := http.TimeoutHandler(gr, HttpTimeoutDuration, "Timeout")
 	if wavebase.IsDevMode() {
-		handler = handlers.CORS(handlers.AllowedOrigins([]string{"*"}))(handler)
+		originalHandler := handler
+		handler = http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {
+			origin := r.Header.Get("Origin")
+			if origin != "" {
+				w.Header().Set("Access-Control-Allow-Origin", origin)
+			}
+			w.Header().Set("Access-Control-Allow-Methods", "GET, POST, PUT, DELETE, OPTIONS")
+			w.Header().Set("Access-Control-Allow-Headers", "Content-Type, X-Session-Id, X-AuthKey, Authorization, X-Requested-With, Accept")
+			w.Header().Set("Access-Control-Expose-Headers", "X-ZoneFileInfo, Content-Length, Content-Type")
+			w.Header().Set("Access-Control-Allow-Credentials", "true")
+			
+			if r.Method == "OPTIONS" {
+				w.WriteHeader(204)
+				return
+			}
+			
+			originalHandler.ServeHTTP(w, r)
+		})
 	}
 	server := &http.Server{
 		ReadTimeout:    HttpReadTimeout,
diff --git a/yarn.lock b/yarn.lock
index 8f1dcd413a..59836a5d6a 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -19,6 +19,59 @@ __metadata:
   languageName: node
   linkType: hard
 
+"@ai-sdk/gateway@npm:1.0.9":
+  version: 1.0.9
+  resolution: "@ai-sdk/gateway@npm:1.0.9"
+  dependencies:
+    "@ai-sdk/provider": "npm:2.0.0"
+    "@ai-sdk/provider-utils": "npm:3.0.4"
+  peerDependencies:
+    zod: ^3.25.76 || ^4
+  checksum: 10c0/ed640a39752120c99e6167e7ef2a427074c7e26c8ec8c0bec7770b246cee67b45e1836a32d9b5eca77432c825e25ea10a7ecfdff31fc0e83e233bb65f6ae03a0
+  languageName: node
+  linkType: hard
+
+"@ai-sdk/provider-utils@npm:3.0.4":
+  version: 3.0.4
+  resolution: "@ai-sdk/provider-utils@npm:3.0.4"
+  dependencies:
+    "@ai-sdk/provider": "npm:2.0.0"
+    "@standard-schema/spec": "npm:^1.0.0"
+    eventsource-parser: "npm:^3.0.3"
+    zod-to-json-schema: "npm:^3.24.1"
+  peerDependencies:
+    zod: ^3.25.76 || ^4
+  checksum: 10c0/6732b99310561d72262cdeef40cc58190afa55248dca0eb3a378ef87fede12086e534c68687e0fe5ef5b092da41f3e745857ce3f9b248a272a78c0dc268dffd4
+  languageName: node
+  linkType: hard
+
+"@ai-sdk/provider@npm:2.0.0":
+  version: 2.0.0
+  resolution: "@ai-sdk/provider@npm:2.0.0"
+  dependencies:
+    json-schema: "npm:^0.4.0"
+  checksum: 10c0/e50e520016c9fc0a8b5009cadd47dae2f1c81ec05c1792b9e312d7d15479f024ca8039525813a33425c884e3449019fed21043b1bfabd6a2626152ca9a388199
+  languageName: node
+  linkType: hard
+
+"@ai-sdk/react@npm:^2.0.18":
+  version: 2.0.18
+  resolution: "@ai-sdk/react@npm:2.0.18"
+  dependencies:
+    "@ai-sdk/provider-utils": "npm:3.0.4"
+    ai: "npm:5.0.18"
+    swr: "npm:^2.2.5"
+    throttleit: "npm:2.1.0"
+  peerDependencies:
+    react: ^18 || ^19 || ^19.0.0-rc
+    zod: ^3.25.76 || ^4
+  peerDependenciesMeta:
+    zod:
+      optional: true
+  checksum: 10c0/909ee2071129c73cde49e45112c431c0583489c1162ba4112975714ba60517db01a8f0a3dd68d0bcec98b86fc0db4d2ca3425e5cdb2aa1c79f8a40968aa7d459
+  languageName: node
+  linkType: hard
+
 "@algolia/autocomplete-core@npm:1.17.9":
   version: 1.17.9
   resolution: "@algolia/autocomplete-core@npm:1.17.9"
@@ -4155,6 +4208,13 @@ __metadata:
   languageName: node
   linkType: hard
 
+"@opentelemetry/api@npm:1.9.0":
+  version: 1.9.0
+  resolution: "@opentelemetry/api@npm:1.9.0"
+  checksum: 10c0/9aae2fe6e8a3a3eeb6c1fdef78e1939cf05a0f37f8a4fae4d6bf2e09eb1e06f966ece85805626e01ba5fab48072b94f19b835449e58b6d26720ee19a58298add
+  languageName: node
+  linkType: hard
+
 "@parcel/watcher-android-arm64@npm:2.5.0":
   version: 2.5.0
   resolution: "@parcel/watcher-android-arm64@npm:2.5.0"
@@ -4879,6 +4939,13 @@ __metadata:
   languageName: node
   linkType: hard
 
+"@standard-schema/spec@npm:^1.0.0":
+  version: 1.0.0
+  resolution: "@standard-schema/spec@npm:1.0.0"
+  checksum: 10c0/a1ab9a8bdc09b5b47aa8365d0e0ec40cc2df6437be02853696a0e377321653b0d3ac6f079a8c67d5ddbe9821025584b1fb71d9cc041a6666a96f1fadf2ece15f
+  languageName: node
+  linkType: hard
+
 "@storybook/addon-actions@npm:8.5.8":
   version: 8.5.8
   resolution: "@storybook/addon-actions@npm:8.5.8"
@@ -7486,6 +7553,20 @@ __metadata:
   languageName: node
   linkType: hard
 
+"ai@npm:5.0.18, ai@npm:^5.0.18":
+  version: 5.0.18
+  resolution: "ai@npm:5.0.18"
+  dependencies:
+    "@ai-sdk/gateway": "npm:1.0.9"
+    "@ai-sdk/provider": "npm:2.0.0"
+    "@ai-sdk/provider-utils": "npm:3.0.4"
+    "@opentelemetry/api": "npm:1.9.0"
+  peerDependencies:
+    zod: ^3.25.76 || ^4
+  checksum: 10c0/8a40af2d55f2a7d9201e2f5470898f2a6a803c5dacb5bb64aa9acf8fa824cacae99ea97c2df9a3fd27fe89e1d6e40667a5401eaa56cb61810e13340660dad3db
+  languageName: node
+  linkType: hard
+
 "ajv-formats@npm:^2.1.1":
   version: 2.1.1
   resolution: "ajv-formats@npm:2.1.1"
@@ -11437,6 +11518,13 @@ __metadata:
   languageName: node
   linkType: hard
 
+"eventsource-parser@npm:^3.0.3":
+  version: 3.0.5
+  resolution: "eventsource-parser@npm:3.0.5"
+  checksum: 10c0/5cb75e3f84ff1cfa1cee6199d4fd430c4544855ab03e953ddbe5927e7b31bc2af3933ab8aba6440ba160ed2c48972b6c317f27b8a1d0764c7b12e34e249de631
+  languageName: node
+  linkType: hard
+
 "execa@npm:^5.0.0":
   version: 5.1.1
   resolution: "execa@npm:5.1.1"
@@ -13974,6 +14062,13 @@ __metadata:
   languageName: node
   linkType: hard
 
+"json-schema@npm:^0.4.0":
+  version: 0.4.0
+  resolution: "json-schema@npm:0.4.0"
+  checksum: 10c0/d4a637ec1d83544857c1c163232f3da46912e971d5bf054ba44fdb88f07d8d359a462b4aec46f2745efbc57053365608d88bc1d7b1729f7b4fc3369765639ed3
+  languageName: node
+  linkType: hard
+
 "json-stable-stringify-without-jsonify@npm:^1.0.1":
   version: 1.0.1
   resolution: "json-stable-stringify-without-jsonify@npm:1.0.1"
@@ -20785,6 +20880,18 @@ __metadata:
   languageName: node
   linkType: hard
 
+"swr@npm:^2.2.5":
+  version: 2.3.6
+  resolution: "swr@npm:2.3.6"
+  dependencies:
+    dequal: "npm:^2.0.3"
+    use-sync-external-store: "npm:^1.4.0"
+  peerDependencies:
+    react: ^16.11.0 || ^17.0.0 || ^18.0.0 || ^19.0.0
+  checksum: 10c0/9534f350982e36a3ae0a13da8c0f7da7011fc979e77f306e60c4e5db0f9b84f17172c44f973441ba56bb684b69b0d9838ab40011a6b6b3e32d0cd7f3d5405f99
+  languageName: node
+  linkType: hard
+
 "synckit@npm:^0.9.0":
   version: 0.9.2
   resolution: "synckit@npm:0.9.2"
@@ -21005,6 +21112,13 @@ __metadata:
   languageName: node
   linkType: hard
 
+"throttleit@npm:2.1.0":
+  version: 2.1.0
+  resolution: "throttleit@npm:2.1.0"
+  checksum: 10c0/1696ae849522cea6ba4f4f3beac1f6655d335e51b42d99215e196a718adced0069e48deaaf77f7e89f526ab31de5b5c91016027da182438e6f9280be2f3d5265
+  languageName: node
+  linkType: hard
+
 "thunky@npm:^1.0.2":
   version: 1.1.0
   resolution: "thunky@npm:1.1.0"
@@ -21815,6 +21929,15 @@ __metadata:
   languageName: node
   linkType: hard
 
+"use-sync-external-store@npm:^1.4.0":
+  version: 1.5.0
+  resolution: "use-sync-external-store@npm:1.5.0"
+  peerDependencies:
+    react: ^16.8.0 || ^17.0.0 || ^18.0.0 || ^19.0.0
+  checksum: 10c0/1b8663515c0be34fa653feb724fdcce3984037c78dd4a18f68b2c8be55cc1a1084c578d5b75f158d41b5ddffc2bf5600766d1af3c19c8e329bb20af2ec6f52f4
+  languageName: node
+  linkType: hard
+
 "utf8-byte-length@npm:^1.0.1":
   version: 1.0.5
   resolution: "utf8-byte-length@npm:1.0.5"
@@ -22390,6 +22513,7 @@ __metadata:
   version: 0.0.0-use.local
   resolution: "waveterm@workspace:."
   dependencies:
+    "@ai-sdk/react": "npm:^2.0.18"
     "@chromatic-com/storybook": "npm:^3.2.7"
     "@eslint/js": "npm:^8.57.0"
     "@floating-ui/react": "npm:^0.27.15"
@@ -22438,6 +22562,7 @@ __metadata:
     "@xterm/addon-web-links": "npm:^0.11.0"
     "@xterm/addon-webgl": "npm:^0.18.0"
     "@xterm/xterm": "npm:^5.5.0"
+    ai: "npm:^5.0.18"
     base64-js: "npm:^1.5.1"
     class-variance-authority: "npm:^0.7.1"
     clsx: "npm:^2.1.1"
@@ -22516,6 +22641,7 @@ __metadata:
     winston: "npm:^3.17.0"
     ws: "npm:^8.18.3"
     yaml: "npm:^2.7.1"
+    zod: "npm:^4.0.17"
   languageName: unknown
   linkType: soft
 
@@ -23071,6 +23197,22 @@ __metadata:
   languageName: node
   linkType: hard
 
+"zod-to-json-schema@npm:^3.24.1":
+  version: 3.24.6
+  resolution: "zod-to-json-schema@npm:3.24.6"
+  peerDependencies:
+    zod: ^3.24.1
+  checksum: 10c0/b907ab6d057100bd25a37e5545bf5f0efa5902cd84d3c3ec05c2e51541431a47bd9bf1e5e151a244273409b45f5986d55b26e5d207f98abc5200702f733eb368
+  languageName: node
+  linkType: hard
+
+"zod@npm:^4.0.17":
+  version: 4.0.17
+  resolution: "zod@npm:4.0.17"
+  checksum: 10c0/c56ef4cc02f8f52be8724c5a8b338266202d68477c7606bee9b7299818b75c9adc27f16f4b6704a372f3e7578bd016f389de19bfec766564b7c39d0d327c540a
+  languageName: node
+  linkType: hard
+
 "zwitch@npm:^2.0.0":
   version: 2.0.4
   resolution: "zwitch@npm:2.0.4"

From dff40e088cf6980a97e84496e351e453f0227ef9 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Tue, 19 Aug 2025 23:09:40 -0700
Subject: [PATCH 05/29] checkpoint, got a response

---
 aiprompts/usechat-streamingproto.md | 185 ++++++++++++++++++++++++++++
 pkg/waveai/usechat.go               | 179 +++++++++++++++++++++------
 pkg/web/web.go                      |   4 +-
 3 files changed, 327 insertions(+), 41 deletions(-)
 create mode 100644 aiprompts/usechat-streamingproto.md

diff --git a/aiprompts/usechat-streamingproto.md b/aiprompts/usechat-streamingproto.md
new file mode 100644
index 0000000000..57ab550ba1
--- /dev/null
+++ b/aiprompts/usechat-streamingproto.md
@@ -0,0 +1,185 @@
+Data Stream Protocol
+A data stream follows a special protocol that the AI SDK provides to send information to the frontend.
+
+The data stream protocol uses Server-Sent Events (SSE) format for improved standardization, keep-alive through ping, reconnect capabilities, and better cache handling.
+
+When you provide data streams from a custom backend, you need to set the x-vercel-ai-ui-message-stream header to v1.
+
+The following stream parts are currently supported:
+
+Message Start Part
+Indicates the beginning of a new message with metadata.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"start","messageId":"..."}
+Text Parts
+Text content is streamed using a start/delta/end pattern with unique IDs for each text block.
+
+Text Start Part
+Indicates the beginning of a text block.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"text-start","id":"msg_68679a454370819ca74c8eb3d04379630dd1afb72306ca5d"}
+Text Delta Part
+Contains incremental text content for the text block.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"text-delta","id":"msg_68679a454370819ca74c8eb3d04379630dd1afb72306ca5d","delta":"Hello"}
+Text End Part
+Indicates the completion of a text block.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"text-end","id":"msg_68679a454370819ca74c8eb3d04379630dd1afb72306ca5d"}
+Reasoning Parts
+Reasoning content is streamed using a start/delta/end pattern with unique IDs for each reasoning block.
+
+Reasoning Start Part
+Indicates the beginning of a reasoning block.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"reasoning-start","id":"reasoning_123"}
+Reasoning Delta Part
+Contains incremental reasoning content for the reasoning block.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"reasoning-delta","id":"reasoning_123","delta":"This is some reasoning"}
+Reasoning End Part
+Indicates the completion of a reasoning block.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"reasoning-end","id":"reasoning_123"}
+Source Parts
+Source parts provide references to external content sources.
+
+Source URL Part
+References to external URLs.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"source-url","sourceId":"https://example.com","url":"https://example.com"}
+Source Document Part
+References to documents or files.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"source-document","sourceId":"https://example.com","mediaType":"file","title":"Title"}
+File Part
+The file parts contain references to files with their media type.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"file","url":"https://example.com/file.png","mediaType":"image/png"}
+Data Parts
+Custom data parts allow streaming of arbitrary structured data with type-specific handling.
+
+Format: Server-Sent Event with JSON object where the type includes a custom suffix
+
+Example:
+
+data: {"type":"data-weather","data":{"location":"SF","temperature":100}}
+The data-\* type pattern allows you to define custom data types that your frontend can handle specifically.
+
+Error Part
+The error parts are appended to the message as they are received.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"error","errorText":"error message"}
+Tool Input Start Part
+Indicates the beginning of tool input streaming.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"tool-input-start","toolCallId":"call_fJdQDqnXeGxTmr4E3YPSR7Ar","toolName":"getWeatherInformation"}
+Tool Input Delta Part
+Incremental chunks of tool input as it's being generated.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"tool-input-delta","toolCallId":"call_fJdQDqnXeGxTmr4E3YPSR7Ar","inputTextDelta":"San Francisco"}
+Tool Input Available Part
+Indicates that tool input is complete and ready for execution.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"tool-input-available","toolCallId":"call_fJdQDqnXeGxTmr4E3YPSR7Ar","toolName":"getWeatherInformation","input":{"city":"San Francisco"}}
+Tool Output Available Part
+Contains the result of tool execution.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"tool-output-available","toolCallId":"call_fJdQDqnXeGxTmr4E3YPSR7Ar","output":{"city":"San Francisco","weather":"sunny"}}
+Start Step Part
+A part indicating the start of a step.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"start-step"}
+Finish Step Part
+A part indicating that a step (i.e., one LLM API call in the backend) has been completed.
+
+This part is necessary to correctly process multiple stitched assistant calls, e.g. when calling tools in the backend, and using steps in useChat at the same time.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"finish-step"}
+Finish Message Part
+A part indicating the completion of a message.
+
+Format: Server-Sent Event with JSON object
+
+Example:
+
+data: {"type":"finish"}
+Stream Termination
+The stream ends with a special [DONE] marker.
+
+Format: Server-Sent Event with literal [DONE]
+
+Example:
+
+data: [DONE]
+The data stream protocol is supported by useChat and useCompletion on the frontend and used by default. useCompletion only supports the text and data stream parts.
+
+On the backend, you can use toUIMessageStreamResponse() from the streamText result object to return a streaming HTTP response.
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index 1871ca7c38..e7a241d2d4 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -5,10 +5,14 @@ package waveai
 
 import (
 	"context"
+	"crypto/rand"
+	"encoding/hex"
 	"encoding/json"
 	"fmt"
 	"io"
 	"net/http"
+	"strings"
+	"time"
 
 	openaiapi "github.com/sashabaranov/go-openai"
 	"github.com/wavetermdev/waveterm/pkg/waveobj"
@@ -23,9 +27,32 @@ const (
 	UseChatConnection     = "keep-alive"
 )
 
+type UseChatMessagePart struct {
+	Type string `json:"type"`
+	Text string `json:"text"`
+}
+
 type UseChatMessage struct {
-	Role    string `json:"role"`
-	Content string `json:"content"`
+	Role    string               `json:"role"`
+	Content string               `json:"content,omitempty"`
+	Parts   []UseChatMessagePart `json:"parts,omitempty"`
+}
+
+// GetContent extracts the text content from either content field or parts array
+func (m *UseChatMessage) GetContent() string {
+	if m.Content != "" {
+		return m.Content
+	}
+	if len(m.Parts) > 0 {
+		var content strings.Builder
+		for _, part := range m.Parts {
+			if part.Type == "text" {
+				content.WriteString(part.Text)
+			}
+		}
+		return content.String()
+	}
+	return ""
 }
 
 type UseChatRequest struct {
@@ -33,28 +60,30 @@ type UseChatRequest struct {
 	Options  map[string]any   `json:"options,omitempty"`
 }
 
-type UseChatTextResponse struct {
-	Type string `json:"type"`
-	Text string `json:"text"`
+// OpenAI Chat Completion streaming response format
+type OpenAIStreamChoice struct {
+	Index int `json:"index"`
+	Delta struct {
+		Content string `json:"content,omitempty"`
+	} `json:"delta"`
+	FinishReason *string `json:"finish_reason"`
 }
 
-type UseChatFinishResponse struct {
-	Type         string                `json:"type"`
-	FinishReason string                `json:"finish_reason"`
-	Usage        *UseChatUsageResponse `json:"usage,omitempty"`
+type OpenAIStreamResponse struct {
+	ID      string               `json:"id"`
+	Object  string               `json:"object"`
+	Created int64                `json:"created"`
+	Model   string               `json:"model"`
+	Choices []OpenAIStreamChoice `json:"choices"`
+	Usage   *OpenAIUsageResponse `json:"usage,omitempty"`
 }
 
-type UseChatUsageResponse struct {
+type OpenAIUsageResponse struct {
 	PromptTokens     int `json:"prompt_tokens"`
 	CompletionTokens int `json:"completion_tokens"`
 	TotalTokens      int `json:"total_tokens"`
 }
 
-type UseChatErrorResponse struct {
-	Type  string `json:"type"`
-	Error string `json:"error"`
-}
-
 func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOptions map[string]any) (*wshrpc.WaveAIOptsType, error) {
 	// Get block metadata
 	block, err := wstore.DBMustGet[*waveobj.Block](ctx, blockId)
@@ -84,7 +113,14 @@ func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOpti
 	// Load preset configuration
 	var presetConfig map[string]any
 	if finalPreset != "default" {
-		if preset, ok := fullConfig.Presets[fmt.Sprintf("ai@%s", finalPreset)]; ok {
+		// Check if preset already has ai@ prefix
+		var presetKey string
+		if strings.HasPrefix(finalPreset, "ai@") {
+			presetKey = finalPreset
+		} else {
+			presetKey = fmt.Sprintf("ai@%s", finalPreset)
+		}
+		if preset, ok := fullConfig.Presets[presetKey]; ok {
 			presetConfig = preset
 		}
 	}
@@ -210,9 +246,13 @@ func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOpti
 func convertUseChatMessagesToPrompt(messages []UseChatMessage) []wshrpc.WaveAIPromptMessageType {
 	var prompt []wshrpc.WaveAIPromptMessageType
 	for _, msg := range messages {
+		content := msg.GetContent()
+		if strings.TrimSpace(content) == "" {
+			continue
+		}
 		prompt = append(prompt, wshrpc.WaveAIPromptMessageType{
 			Role:    msg.Role,
-			Content: msg.Content,
+			Content: content,
 		})
 	}
 	return prompt
@@ -233,12 +273,17 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 
 	client := openaiapi.NewClientWithConfig(clientConfig)
 
-	// Convert messages
+	// Convert messages, filtering out empty content
 	var openaiMessages []openaiapi.ChatCompletionMessage
 	for _, msg := range messages {
+		content := msg.GetContent()
+		// Skip messages with empty content as OpenAI requires non-empty content
+		if strings.TrimSpace(content) == "" {
+			continue
+		}
 		openaiMessages = append(openaiMessages, openaiapi.ChatCompletionMessage{
 			Role:    msg.Role,
-			Content: msg.Content,
+			Content: content,
 		})
 	}
 
@@ -260,36 +305,59 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 	// Create stream
 	stream, err := client.CreateChatCompletionStream(ctx, req)
 	if err != nil {
-		writeUseChatError(w, fmt.Sprintf("OpenAI API error: %v", err))
+		// Return HTTP error instead of streaming error
+		http.Error(w, fmt.Sprintf("OpenAI API error: %v", err), http.StatusBadRequest)
 		return
 	}
 	defer stream.Close()
 
+	// Generate IDs for the streaming protocol
+	messageId := "msg_" + generateID()
+	textId := "text_" + generateID()
+
+	// Send message start
+	writeMessageStart(w, messageId)
+	if flusher, ok := w.(http.Flusher); ok {
+		flusher.Flush()
+	}
+
+	// Send text start
+	writeTextStart(w, textId)
+	if flusher, ok := w.(http.Flusher); ok {
+		flusher.Flush()
+	}
+
 	// Stream responses
 	for {
 		response, err := stream.Recv()
 		if err == io.EOF {
+			// Send text end and finish
+			writeTextEnd(w, textId)
+			writeOpenAIFinish(w, "stop", nil)
 			writeUseChatDone(w)
 			return
 		}
 		if err != nil {
-			writeUseChatError(w, fmt.Sprintf("Stream error: %v", err))
+			// For streaming errors, we can't send HTTP errors anymore since headers are sent
+			// Just log and break the stream
+			fmt.Printf("Stream error: %v\n", err)
 			return
 		}
 
 		// Process choices
 		for _, choice := range response.Choices {
 			if choice.Delta.Content != "" {
-				writeUseChatText(w, choice.Delta.Content)
+				writeUseChatTextDelta(w, textId, choice.Delta.Content)
 			}
 			if choice.FinishReason != "" {
-				usage := &UseChatUsageResponse{}
-				if response.Usage.PromptTokens > 0 {
+				usage := &OpenAIUsageResponse{}
+				if response.Usage != nil && response.Usage.PromptTokens > 0 {
 					usage.PromptTokens = response.Usage.PromptTokens
 					usage.CompletionTokens = response.Usage.CompletionTokens
 					usage.TotalTokens = response.Usage.TotalTokens
 				}
-				writeUseChatFinish(w, string(choice.FinishReason), usage)
+				writeTextEnd(w, textId)
+				writeOpenAIFinish(w, string(choice.FinishReason), usage)
 			}
 		}
 
@@ -300,33 +368,65 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 	}
 }
 
-func writeUseChatText(w http.ResponseWriter, text string) {
-	resp := UseChatTextResponse{
-		Type: "text",
-		Text: text,
+func writeMessageStart(w http.ResponseWriter, messageId string) {
+	resp := map[string]interface{}{
+		"type":      "start",
+		"messageId": messageId,
 	}
 	data, _ := json.Marshal(resp)
 	fmt.Fprintf(w, "data: %s\n\n", data)
 }
 
-func writeUseChatFinish(w http.ResponseWriter, finishReason string, usage *UseChatUsageResponse) {
-	resp := UseChatFinishResponse{
-		Type:         "finish",
-		FinishReason: finishReason,
-		Usage:        usage,
+func writeTextStart(w http.ResponseWriter, textId string) {
+	resp := map[string]interface{}{
+		"type": "text-start",
+		"id":   textId,
 	}
 	data, _ := json.Marshal(resp)
 	fmt.Fprintf(w, "data: %s\n\n", data)
 }
 
-func writeUseChatError(w http.ResponseWriter, errorMsg string) {
-	resp := UseChatErrorResponse{
-		Type:  "error",
-		Error: errorMsg,
+func writeUseChatTextDelta(w http.ResponseWriter, textId string, text string) {
+	resp := map[string]interface{}{
+		"type":  "text-delta",
+		"id":    textId,
+		"delta": text,
+	}
+	data, _ := json.Marshal(resp)
+	fmt.Fprintf(w, "data: %s\n\n", data)
+}
+
+func writeTextEnd(w http.ResponseWriter, textId string) {
+	resp := map[string]interface{}{
+		"type": "text-end",
+		"id":   textId,
+	}
+	data, _ := json.Marshal(resp)
+	fmt.Fprintf(w, "data: %s\n\n", data)
+}
+
+func writeOpenAIFinish(w http.ResponseWriter, finishReason string, usage *OpenAIUsageResponse) {
+	resp := map[string]interface{}{
+		"type": "finish",
 	}
 	data, _ := json.Marshal(resp)
 	fmt.Fprintf(w, "data: %s\n\n", data)
-	writeUseChatDone(w)
+}
+
+func writeUseChatError(w http.ResponseWriter, errorMsg string) {
+	// For errors, return HTTP error instead of streaming format
+	// This prevents the AI SDK validation error
+	http.Error(w, errorMsg, http.StatusInternalServerError)
+}
+
+func generateID() string {
+	bytes := make([]byte, 16)
+	rand.Read(bytes)
+	return hex.EncodeToString(bytes)
+}
+
+func getCurrentTimestamp() int64 {
+	return time.Now().Unix()
 }
 
 func writeUseChatDone(w http.ResponseWriter) {
@@ -384,6 +484,7 @@ func HandleAIChat(w http.ResponseWriter, r *http.Request) {
 	w.Header().Set("Content-Type", UseChatContentTypeSSE)
 	w.Header().Set("Cache-Control", UseChatCacheControl)
 	w.Header().Set("Connection", UseChatConnection)
+	w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
 
 	// Stream OpenAI response
 	streamOpenAIToUseChat(w, r.Context(), aiOpts, req.Messages)
diff --git a/pkg/web/web.go b/pkg/web/web.go
index 0a488b517e..52d517a852 100644
--- a/pkg/web/web.go
+++ b/pkg/web/web.go
@@ -468,8 +468,8 @@ func RunWebServer(listener net.Listener) {
 				w.Header().Set("Access-Control-Allow-Origin", origin)
 			}
 			w.Header().Set("Access-Control-Allow-Methods", "GET, POST, PUT, DELETE, OPTIONS")
-			w.Header().Set("Access-Control-Allow-Headers", "Content-Type, X-Session-Id, X-AuthKey, Authorization, X-Requested-With, Accept")
-			w.Header().Set("Access-Control-Expose-Headers", "X-ZoneFileInfo, Content-Length, Content-Type")
+			w.Header().Set("Access-Control-Allow-Headers", "Content-Type, X-Session-Id, X-AuthKey, Authorization, X-Requested-With, Accept, x-vercel-ai-ui-message-stream")
+			w.Header().Set("Access-Control-Expose-Headers", "X-ZoneFileInfo, Content-Length, Content-Type, x-vercel-ai-ui-message-stream")
 			w.Header().Set("Access-Control-Allow-Credentials", "true")
 			
 			if r.Method == "OPTIONS" {

From 68c4722da03eb075f57882585adf9816df0131ff Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Tue, 19 Aug 2025 23:21:53 -0700
Subject: [PATCH 06/29] fix issues with streaming response

---
 pkg/waveai/usechat.go | 34 +++++++++++++++++++++++-----------
 1 file changed, 23 insertions(+), 11 deletions(-)

diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index e7a241d2d4..bd61c6039c 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -311,9 +311,9 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 	}
 	defer stream.Close()
 
-	// Generate IDs for the streaming protocol
-	messageId := "msg_" + generateID()
-	textId := "text_" + generateID()
+	// Generate IDs for the streaming protocol - use shorter, simpler IDs
+	messageId := generateID()
+	textId := generateID()
 
 	// Send message start
 	writeMessageStart(w, messageId)
@@ -321,18 +321,19 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 		flusher.Flush()
 	}
 
-	// Send text start
-	writeTextStart(w, textId)
-	if flusher, ok := w.(http.Flusher); ok {
-		flusher.Flush()
-	}
+	// Track whether we've started text streaming
+	textStarted := false
+	textEnded := false
 
 	// Stream responses
 	for {
 		response, err := stream.Recv()
 		if err == io.EOF {
-			// Send text end and finish
-			writeTextEnd(w, textId)
+			// Send text end and finish if text was started but not ended
+			if textStarted && !textEnded {
+				writeTextEnd(w, textId)
+				textEnded = true
+			}
 			writeOpenAIFinish(w, "stop", nil)
 			writeUseChatDone(w)
 			return
@@ -347,6 +348,14 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 		// Process choices
 		for _, choice := range response.Choices {
 			if choice.Delta.Content != "" {
+				// Send text start only when we have actual content
+				if !textStarted {
+					writeTextStart(w, textId)
+					textStarted = true
+					if flusher, ok := w.(http.Flusher); ok {
+						flusher.Flush()
+					}
+				}
 				writeUseChatTextDelta(w, textId, choice.Delta.Content)
 			}
 			if choice.FinishReason != "" {
@@ -356,7 +365,10 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 					usage.CompletionTokens = response.Usage.CompletionTokens
 					usage.TotalTokens = response.Usage.TotalTokens
 				}
-				writeTextEnd(w, textId)
+				if textStarted && !textEnded {
+					writeTextEnd(w, textId)
+					textEnded = true
+				}
 				writeOpenAIFinish(w, string(choice.FinishReason), usage)
 			}
 		}

From 29c65bdf212803247925a38943326a0605da1dd1 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Tue, 19 Aug 2025 23:23:09 -0700
Subject: [PATCH 07/29] add reference to doc

---
 pkg/waveai/usechat.go | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index bd61c6039c..691a22eb35 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -27,6 +27,8 @@ const (
 	UseChatConnection     = "keep-alive"
 )
 
+// see /aiprompts/usechat-streamingproto.md for protocol
+
 type UseChatMessagePart struct {
 	Type string `json:"type"`
 	Text string `json:"text"`

From 942d7758f7fab0af72c7de298f9ad9031f967ff9 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Tue, 19 Aug 2025 23:42:54 -0700
Subject: [PATCH 08/29] checkpoint, flushing

---
 pkg/waveai/usechat.go | 99 ++++++++++++++++++++++++++++++-------------
 1 file changed, 70 insertions(+), 29 deletions(-)

diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index 691a22eb35..a2db3c36d1 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -261,6 +261,30 @@ func convertUseChatMessagesToPrompt(messages []UseChatMessage) []wshrpc.WaveAIPr
 }
 
 func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+	// Set up keepalive ticker immediately
+	keepaliveTicker := time.NewTicker(1 * time.Second)
+	defer keepaliveTicker.Stop()
+
+	// Create a channel to signal when streaming is done
+	done := make(chan bool)
+	defer close(done)
+
+	// Start keepalive goroutine immediately
+	go func() {
+		for {
+			select {
+			case <-keepaliveTicker.C:
+				// Send SSE keepalive comment
+				fmt.Fprintf(w, ": keepalive\n\n")
+				tryFlush(w)
+			case <-done:
+				return
+			case <-ctx.Done():
+				return
+			}
+		}
+	}()
+
 	// Set up OpenAI client
 	clientConfig := openaiapi.DefaultConfig(opts.APIToken)
 	if opts.BaseURL != "" {
@@ -307,8 +331,9 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 	// Create stream
 	stream, err := client.CreateChatCompletionStream(ctx, req)
 	if err != nil {
-		// Return HTTP error instead of streaming error
-		http.Error(w, fmt.Sprintf("OpenAI API error: %v", err), http.StatusBadRequest)
+		// Send error in SSE format since headers are already sent
+		writeUseChatError(w, fmt.Sprintf("OpenAI API error: %v", err))
+		done <- true
 		return
 	}
 	defer stream.Close()
@@ -319,9 +344,7 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 
 	// Send message start
 	writeMessageStart(w, messageId)
-	if flusher, ok := w.(http.Flusher); ok {
-		flusher.Flush()
-	}
+	tryFlush(w)
 
 	// Track whether we've started text streaming
 	textStarted := false
@@ -338,12 +361,13 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 			}
 			writeOpenAIFinish(w, "stop", nil)
 			writeUseChatDone(w)
+			done <- true
 			return
 		}
 		if err != nil {
-			// For streaming errors, we can't send HTTP errors anymore since headers are sent
-			// Just log and break the stream
-			fmt.Printf("Stream error: %v\n", err)
+			// Send error in SSE format since headers are already sent
+			writeUseChatError(w, fmt.Sprintf("Stream error: %v", err))
+			done <- true
 			return
 		}
 
@@ -354,9 +378,6 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 				if !textStarted {
 					writeTextStart(w, textId)
 					textStarted = true
-					if flusher, ok := w.(http.Flusher); ok {
-						flusher.Flush()
-					}
 				}
 				writeUseChatTextDelta(w, textId, choice.Delta.Content)
 			}
@@ -376,9 +397,7 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 		}
 
 		// Flush the response
-		if flusher, ok := w.(http.Flusher); ok {
-			flusher.Flush()
-		}
+		tryFlush(w)
 	}
 }
 
@@ -389,6 +408,7 @@ func writeMessageStart(w http.ResponseWriter, messageId string) {
 	}
 	data, _ := json.Marshal(resp)
 	fmt.Fprintf(w, "data: %s\n\n", data)
+	tryFlush(w)
 }
 
 func writeTextStart(w http.ResponseWriter, textId string) {
@@ -398,6 +418,7 @@ func writeTextStart(w http.ResponseWriter, textId string) {
 	}
 	data, _ := json.Marshal(resp)
 	fmt.Fprintf(w, "data: %s\n\n", data)
+	tryFlush(w)
 }
 
 func writeUseChatTextDelta(w http.ResponseWriter, textId string, text string) {
@@ -408,6 +429,7 @@ func writeUseChatTextDelta(w http.ResponseWriter, textId string, text string) {
 	}
 	data, _ := json.Marshal(resp)
 	fmt.Fprintf(w, "data: %s\n\n", data)
+	tryFlush(w)
 }
 
 func writeTextEnd(w http.ResponseWriter, textId string) {
@@ -417,6 +439,7 @@ func writeTextEnd(w http.ResponseWriter, textId string) {
 	}
 	data, _ := json.Marshal(resp)
 	fmt.Fprintf(w, "data: %s\n\n", data)
+	tryFlush(w)
 }
 
 func writeOpenAIFinish(w http.ResponseWriter, finishReason string, usage *OpenAIUsageResponse) {
@@ -425,12 +448,25 @@ func writeOpenAIFinish(w http.ResponseWriter, finishReason string, usage *OpenAI
 	}
 	data, _ := json.Marshal(resp)
 	fmt.Fprintf(w, "data: %s\n\n", data)
+	tryFlush(w)
 }
 
 func writeUseChatError(w http.ResponseWriter, errorMsg string) {
-	// For errors, return HTTP error instead of streaming format
-	// This prevents the AI SDK validation error
-	http.Error(w, errorMsg, http.StatusInternalServerError)
+	// Send error in SSE format
+	resp := map[string]interface{}{
+		"type":      "error",
+		"errorText": errorMsg,
+	}
+	data, _ := json.Marshal(resp)
+	fmt.Fprintf(w, "data: %s\n\n", data)
+	fmt.Fprintf(w, "data: [DONE]\n\n")
+	tryFlush(w)
+}
+
+func tryFlush(w http.ResponseWriter) {
+	if flusher, ok := w.(http.Flusher); ok {
+		flusher.Flush()
+	}
 }
 
 func generateID() string {
@@ -445,6 +481,7 @@ func getCurrentTimestamp() int64 {
 
 func writeUseChatDone(w http.ResponseWriter) {
 	fmt.Fprintf(w, "data: [DONE]\n\n")
+	tryFlush(w)
 }
 
 func HandleAIChat(w http.ResponseWriter, r *http.Request) {
@@ -454,52 +491,56 @@ func HandleAIChat(w http.ResponseWriter, r *http.Request) {
 		return
 	}
 
+	// Set SSE headers immediately
+	w.Header().Set("Content-Type", UseChatContentTypeSSE)
+	w.Header().Set("Cache-Control", UseChatCacheControl)
+	w.Header().Set("Connection", UseChatConnection)
+	w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
+
+	// Send headers immediately
+	w.WriteHeader(http.StatusOK)
+	tryFlush(w)
+
 	// Parse query parameters
 	blockId := r.URL.Query().Get("blockid")
 	presetKey := r.URL.Query().Get("preset")
 
 	if blockId == "" {
-		http.Error(w, "blockid query parameter is required", http.StatusBadRequest)
+		writeUseChatError(w, "blockid query parameter is required")
 		return
 	}
 
 	// Parse request body
 	var req UseChatRequest
 	if err := json.NewDecoder(r.Body).Decode(&req); err != nil {
-		http.Error(w, fmt.Sprintf("Invalid request body: %v", err), http.StatusBadRequest)
+		writeUseChatError(w, fmt.Sprintf("Invalid request body: %v", err))
 		return
 	}
 
 	// Resolve AI configuration
 	aiOpts, err := resolveAIConfig(r.Context(), blockId, presetKey, req.Options)
 	if err != nil {
-		http.Error(w, fmt.Sprintf("Configuration error: %v", err), http.StatusBadRequest)
+		writeUseChatError(w, fmt.Sprintf("Configuration error: %v", err))
 		return
 	}
 
 	// Validate configuration
 	if aiOpts.Model == "" {
-		http.Error(w, "No AI model specified", http.StatusBadRequest)
+		writeUseChatError(w, "No AI model specified")
 		return
 	}
 
 	// For now, only support OpenAI
 	if aiOpts.APIType != APIType_OpenAI && aiOpts.APIType != "" {
-		http.Error(w, fmt.Sprintf("Unsupported API type: %s (only OpenAI supported in POC)", aiOpts.APIType), http.StatusBadRequest)
+		writeUseChatError(w, fmt.Sprintf("Unsupported API type: %s (only OpenAI supported in POC)", aiOpts.APIType))
 		return
 	}
 
 	if aiOpts.APIToken == "" {
-		http.Error(w, "No API token provided", http.StatusBadRequest)
+		writeUseChatError(w, "No API token provided")
 		return
 	}
 
-	// Set SSE headers
-	w.Header().Set("Content-Type", UseChatContentTypeSSE)
-	w.Header().Set("Cache-Control", UseChatCacheControl)
-	w.Header().Set("Connection", UseChatConnection)
-	w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
-
 	// Stream OpenAI response
 	streamOpenAIToUseChat(w, r.Context(), aiOpts, req.Messages)
 }

From c98bcca6ca3885ca711ca2fb40fc0ae029a792e7 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 10:32:38 -0700
Subject: [PATCH 09/29] quickdev to restart server faster when just iterating
 on go code on mac

---
 Taskfile.yml | 33 +++++++++++++++++++++++++++++++++
 1 file changed, 33 insertions(+)

diff --git a/Taskfile.yml b/Taskfile.yml
index 3717b743ee..f962a21919 100644
--- a/Taskfile.yml
+++ b/Taskfile.yml
@@ -42,6 +42,16 @@ tasks:
             WCLOUD_ENDPOINT: "https://api-dev.waveterm.dev"
             WCLOUD_WS_ENDPOINT: "wss://wsapi-dev.waveterm.dev"
 
+    electron:quickdev:
+        desc: Run the Electron application via the Vite dev server (quick dev - no docsite, arm64 only, no generate, no wsh).
+        cmd: yarn dev
+        deps:
+            - yarn
+            - build:backend:quickdev
+        env:
+            WCLOUD_ENDPOINT: "https://api-dev.waveterm.dev/central"
+            WCLOUD_WS_ENDPOINT: "wss://wsapi-dev.waveterm.dev/"
+
     storybook:
         desc: Start the Storybook server.
         cmd: yarn storybook
@@ -114,6 +124,11 @@ tasks:
             - task: build:server
             - task: build:wsh
 
+    build:backend:quickdev:
+        desc: Build only the wavesrv component for quickdev (arm64 macOS only, no generate, no wsh).
+        cmds:
+            - task: build:server:quickdev
+
     build:schema:
         desc: Build the schema for configuration.
         sources:
@@ -153,6 +168,24 @@ tasks:
               vars:
                   ARCHS: arm64,amd64
 
+    build:server:quickdev:
+        desc: Build the wavesrv component for quickdev (arm64 macOS only, no generate).
+        platforms: [darwin]
+        cmds:
+            - cmd: "{{.RM}} dist/bin/wavesrv*"
+              ignore_error: true
+            - task: build:server:internal
+              vars:
+                  ARCHS: arm64
+        deps:
+            - go:mod:tidy
+        sources:
+            - "cmd/server/*.go"
+            - "pkg/**/*.go"
+            - "pkg/**/*.json"
+        generates:
+            - dist/bin/wavesrv.*
+
     build:server:windows:
         desc: Build the wavesrv component for Windows platforms (only generates artifacts for the current architecture).
         platforms: [windows]

From 864497611bdc32c3de98696d060f751894a1669f Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 10:51:47 -0700
Subject: [PATCH 10/29] fix sse streaming

---
 pkg/waveai/usechat.go | 52 ++++++++++++++++++++++++++-----------------
 pkg/web/web.go        | 27 ++++++++++++++++------
 2 files changed, 52 insertions(+), 27 deletions(-)

diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index a2db3c36d1..0b540805e2 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -10,6 +10,7 @@ import (
 	"encoding/json"
 	"fmt"
 	"io"
+	"log"
 	"net/http"
 	"strings"
 	"time"
@@ -464,8 +465,10 @@ func writeUseChatError(w http.ResponseWriter, errorMsg string) {
 }
 
 func tryFlush(w http.ResponseWriter) {
-	if flusher, ok := w.(http.Flusher); ok {
-		flusher.Flush()
+	rc := http.NewResponseController(w)
+	if err := rc.Flush(); err != nil {
+		// client closed connection, or flush not supported
+		return
 	}
 }
 
@@ -491,56 +494,65 @@ func HandleAIChat(w http.ResponseWriter, r *http.Request) {
 		return
 	}
 
-	// Set SSE headers immediately
-	w.Header().Set("Content-Type", UseChatContentTypeSSE)
-	w.Header().Set("Cache-Control", UseChatCacheControl)
-	w.Header().Set("Connection", UseChatConnection)
-	w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
-
-	// Send headers immediately
-	w.WriteHeader(http.StatusOK)
-	tryFlush(w)
-
-	// Parse query parameters
+	// Parse query parameters first
 	blockId := r.URL.Query().Get("blockid")
 	presetKey := r.URL.Query().Get("preset")
 
 	if blockId == "" {
-		writeUseChatError(w, "blockid query parameter is required")
+		http.Error(w, "blockid query parameter is required", http.StatusBadRequest)
 		return
 	}
 
-	// Parse request body
+	// Parse request body completely before sending any response
 	var req UseChatRequest
 	if err := json.NewDecoder(r.Body).Decode(&req); err != nil {
-		writeUseChatError(w, fmt.Sprintf("Invalid request body: %v", err))
+		http.Error(w, fmt.Sprintf("Invalid request body: %v", err), http.StatusBadRequest)
 		return
 	}
 
 	// Resolve AI configuration
 	aiOpts, err := resolveAIConfig(r.Context(), blockId, presetKey, req.Options)
 	if err != nil {
-		writeUseChatError(w, fmt.Sprintf("Configuration error: %v", err))
+		http.Error(w, fmt.Sprintf("Configuration error: %v", err), http.StatusInternalServerError)
 		return
 	}
 
 	// Validate configuration
 	if aiOpts.Model == "" {
-		writeUseChatError(w, "No AI model specified")
+		http.Error(w, "No AI model specified", http.StatusBadRequest)
 		return
 	}
 
 	// For now, only support OpenAI
 	if aiOpts.APIType != APIType_OpenAI && aiOpts.APIType != "" {
-		writeUseChatError(w, fmt.Sprintf("Unsupported API type: %s (only OpenAI supported in POC)", aiOpts.APIType))
+		http.Error(w, fmt.Sprintf("Unsupported API type: %s (only OpenAI supported in POC)", aiOpts.APIType), http.StatusBadRequest)
 		return
 	}
 
 	if aiOpts.APIToken == "" {
-		writeUseChatError(w, "No API token provided")
+		http.Error(w, "No API token provided", http.StatusBadRequest)
 		return
 	}
 
+	// Reset write deadline for streaming to prevent timeouts
+	rc := http.NewResponseController(w)
+	if err := rc.SetWriteDeadline(time.Time{}); err != nil {
+		log.Printf("failed to reset write deadline for streaming: %v", err)
+	}
+
+	// NOW set SSE headers after all validation and body parsing is complete
+	w.Header().Set("Content-Type", UseChatContentTypeSSE)
+	w.Header().Set("Cache-Control", "no-cache, no-store, must-revalidate")
+	w.Header().Set("Connection", UseChatConnection)
+	w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
+	w.Header().Set("X-Accel-Buffering", "no")       // Disable nginx buffering
+	w.Header().Set("Cache-Control", "no-transform") // Prevent proxy transformation
+
+	// Send headers and a tiny first chunk to establish streaming
+	w.WriteHeader(http.StatusOK)
+	fmt.Fprintf(w, ": stream-start\n\n") // Send initial SSE comment
+	tryFlush(w)
+
 	// Stream OpenAI response
 	streamOpenAIToUseChat(w, r.Context(), aiOpts, req.Messages)
 }
diff --git a/pkg/web/web.go b/pkg/web/web.go
index 52d517a852..af2dd291d6 100644
--- a/pkg/web/web.go
+++ b/pkg/web/web.go
@@ -449,17 +449,30 @@ const schemaPrefix = "/schema/"
 // blocking
 func RunWebServer(listener net.Listener) {
 	gr := mux.NewRouter()
-	gr.HandleFunc("/wave/stream-local-file", WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamLocalFile))
-	gr.HandleFunc("/wave/stream-file", WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamFile))
-	gr.PathPrefix("/wave/stream-file/").HandlerFunc(WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamFile))
-	gr.HandleFunc("/wave/file", WebFnWrap(WebFnOpts{AllowCaching: false}, handleWaveFile))
-	gr.HandleFunc("/wave/service", WebFnWrap(WebFnOpts{JsonErrors: true}, handleService))
+	
+	// Create separate routers for different timeout requirements
+	waveRouter := mux.NewRouter()
+	waveRouter.HandleFunc("/wave/stream-local-file", WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamLocalFile))
+	waveRouter.HandleFunc("/wave/stream-file", WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamFile))
+	waveRouter.PathPrefix("/wave/stream-file/").HandlerFunc(WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamFile))
+	waveRouter.HandleFunc("/wave/file", WebFnWrap(WebFnOpts{AllowCaching: false}, handleWaveFile))
+	waveRouter.HandleFunc("/wave/service", WebFnWrap(WebFnOpts{JsonErrors: true}, handleService))
+	
+	vdomRouter := mux.NewRouter()
+	vdomRouter.HandleFunc("/vdom/{uuid}/{path:.*}", WebFnWrap(WebFnOpts{AllowCaching: true}, handleVDom))
+	
+	// Routes that need timeout handling
+	gr.PathPrefix("/wave/").Handler(http.TimeoutHandler(waveRouter, HttpTimeoutDuration, "Timeout"))
+	gr.PathPrefix("/vdom/").Handler(http.TimeoutHandler(vdomRouter, HttpTimeoutDuration, "Timeout"))
+	
+	// Routes that should NOT have timeout handling (for streaming)
 	gr.HandleFunc("/api/aichat", WebFnWrap(WebFnOpts{AllowCaching: false}, waveai.HandleAIChat))
-	gr.HandleFunc("/vdom/{uuid}/{path:.*}", WebFnWrap(WebFnOpts{AllowCaching: true}, handleVDom))
+	
+	// Other routes without timeout
 	gr.PathPrefix(docsitePrefix).Handler(http.StripPrefix(docsitePrefix, docsite.GetDocsiteHandler()))
 	gr.PathPrefix(schemaPrefix).Handler(http.StripPrefix(schemaPrefix, schema.GetSchemaHandler()))
 
-	handler := http.TimeoutHandler(gr, HttpTimeoutDuration, "Timeout")
+	handler := http.Handler(gr)
 	if wavebase.IsDevMode() {
 		originalHandler := handler
 		handler = http.HandlerFunc(func(w http.ResponseWriter, r *http.Request) {

From 029000b17d6e6e77c3b8ee22e09d8b47bc9fad98 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 11:02:37 -0700
Subject: [PATCH 11/29] fix HMR ignore rules for vite

---
 electron.vite.config.ts |  3 +++
 pkg/waveai/usechat.go   |  4 ----
 pkg/web/web.go          | 14 +++++++-------
 3 files changed, 10 insertions(+), 11 deletions(-)

diff --git a/electron.vite.config.ts b/electron.vite.config.ts
index 36e8a85657..acfd7bbdb8 100644
--- a/electron.vite.config.ts
+++ b/electron.vite.config.ts
@@ -69,6 +69,9 @@ export default defineConfig({
         },
         server: {
             open: false,
+            watch: {
+                ignored: ["**/*.go", "**/go.mod", "**/go.sum", "**/*.md", "**/*.json"],
+            },
         },
         css: {
             preprocessorOptions: {
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index 0b540805e2..2178bc2bb2 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -478,10 +478,6 @@ func generateID() string {
 	return hex.EncodeToString(bytes)
 }
 
-func getCurrentTimestamp() int64 {
-	return time.Now().Unix()
-}
-
 func writeUseChatDone(w http.ResponseWriter) {
 	fmt.Fprintf(w, "data: [DONE]\n\n")
 	tryFlush(w)
diff --git a/pkg/web/web.go b/pkg/web/web.go
index af2dd291d6..07d0625a6e 100644
--- a/pkg/web/web.go
+++ b/pkg/web/web.go
@@ -449,7 +449,7 @@ const schemaPrefix = "/schema/"
 // blocking
 func RunWebServer(listener net.Listener) {
 	gr := mux.NewRouter()
-	
+
 	// Create separate routers for different timeout requirements
 	waveRouter := mux.NewRouter()
 	waveRouter.HandleFunc("/wave/stream-local-file", WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamLocalFile))
@@ -457,17 +457,17 @@ func RunWebServer(listener net.Listener) {
 	waveRouter.PathPrefix("/wave/stream-file/").HandlerFunc(WebFnWrap(WebFnOpts{AllowCaching: true}, handleStreamFile))
 	waveRouter.HandleFunc("/wave/file", WebFnWrap(WebFnOpts{AllowCaching: false}, handleWaveFile))
 	waveRouter.HandleFunc("/wave/service", WebFnWrap(WebFnOpts{JsonErrors: true}, handleService))
-	
+
 	vdomRouter := mux.NewRouter()
 	vdomRouter.HandleFunc("/vdom/{uuid}/{path:.*}", WebFnWrap(WebFnOpts{AllowCaching: true}, handleVDom))
-	
+
 	// Routes that need timeout handling
 	gr.PathPrefix("/wave/").Handler(http.TimeoutHandler(waveRouter, HttpTimeoutDuration, "Timeout"))
 	gr.PathPrefix("/vdom/").Handler(http.TimeoutHandler(vdomRouter, HttpTimeoutDuration, "Timeout"))
-	
+
 	// Routes that should NOT have timeout handling (for streaming)
 	gr.HandleFunc("/api/aichat", WebFnWrap(WebFnOpts{AllowCaching: false}, waveai.HandleAIChat))
-	
+
 	// Other routes without timeout
 	gr.PathPrefix(docsitePrefix).Handler(http.StripPrefix(docsitePrefix, docsite.GetDocsiteHandler()))
 	gr.PathPrefix(schemaPrefix).Handler(http.StripPrefix(schemaPrefix, schema.GetSchemaHandler()))
@@ -484,12 +484,12 @@ func RunWebServer(listener net.Listener) {
 			w.Header().Set("Access-Control-Allow-Headers", "Content-Type, X-Session-Id, X-AuthKey, Authorization, X-Requested-With, Accept, x-vercel-ai-ui-message-stream")
 			w.Header().Set("Access-Control-Expose-Headers", "X-ZoneFileInfo, Content-Length, Content-Type, x-vercel-ai-ui-message-stream")
 			w.Header().Set("Access-Control-Allow-Credentials", "true")
-			
+
 			if r.Method == "OPTIONS" {
 				w.WriteHeader(204)
 				return
 			}
-			
+
 			originalHandler.ServeHTTP(w, r)
 		})
 	}

From 5c9b736559ad3143899c214bfa25f42a020f5a8f Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 11:03:32 -0700
Subject: [PATCH 12/29] revert to old impl for now

---
 frontend/app/view/waveai/waveai.tsx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/frontend/app/view/waveai/waveai.tsx b/frontend/app/view/waveai/waveai.tsx
index 355e1b5aba..0be7168a45 100644
--- a/frontend/app/view/waveai/waveai.tsx
+++ b/frontend/app/view/waveai/waveai.tsx
@@ -889,7 +889,7 @@ const WaveAiOld = ({ model }: { model: WaveAiModel; blockId: string }) => {
 };
 
 const WaveAi = ({ model, blockId }: { model: WaveAiModel; blockId: string }) => {
-    const useNewImplementation = true;
+    const useNewImplementation = false;
 
     if (useNewImplementation) {
         const useChatModel = useMemo(() => new WaveAiUseChatModel(blockId), [blockId]);

From e0fc5d7a217a0db62d6bc9c2319c4a1442d9df95 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 11:19:26 -0700
Subject: [PATCH 13/29] new ssehandler struct

---
 frontend/app/view/waveai/waveai.tsx |   2 +-
 pkg/waveai/ssehandler.go            | 195 ++++++++++++++++++++++++++++
 pkg/waveai/usechat.go               | 140 +++++---------------
 3 files changed, 228 insertions(+), 109 deletions(-)
 create mode 100644 pkg/waveai/ssehandler.go

diff --git a/frontend/app/view/waveai/waveai.tsx b/frontend/app/view/waveai/waveai.tsx
index 0be7168a45..355e1b5aba 100644
--- a/frontend/app/view/waveai/waveai.tsx
+++ b/frontend/app/view/waveai/waveai.tsx
@@ -889,7 +889,7 @@ const WaveAiOld = ({ model }: { model: WaveAiModel; blockId: string }) => {
 };
 
 const WaveAi = ({ model, blockId }: { model: WaveAiModel; blockId: string }) => {
-    const useNewImplementation = false;
+    const useNewImplementation = true;
 
     if (useNewImplementation) {
         const useChatModel = useMemo(() => new WaveAiUseChatModel(blockId), [blockId]);
diff --git a/pkg/waveai/ssehandler.go b/pkg/waveai/ssehandler.go
new file mode 100644
index 0000000000..c597a57542
--- /dev/null
+++ b/pkg/waveai/ssehandler.go
@@ -0,0 +1,195 @@
+// Copyright 2025, Command Line Inc.
+// SPDX-License-Identifier: Apache-2.0
+
+package waveai
+
+import (
+	"context"
+	"encoding/json"
+	"fmt"
+	"log"
+	"net/http"
+	"time"
+)
+
+const (
+	SSEContentType    = "text/event-stream"
+	SSECacheControl   = "no-cache"
+	SSEConnection     = "keep-alive"
+	SSEKeepaliveMsg   = ": keepalive\n\n"
+	SSEStreamStartMsg = ": stream-start\n\n"
+)
+
+// SSEHandler wraps an http.ResponseWriter to provide Server-Sent Events functionality
+type SSEHandler struct {
+	w               http.ResponseWriter
+	rc              *http.ResponseController
+	keepaliveTicker *time.Ticker
+	done            chan bool
+	ctx             context.Context
+	closed          bool
+}
+
+// MakeSSEHandler creates a new SSE handler wrapping the given ResponseWriter
+func MakeSSEHandler(w http.ResponseWriter, ctx context.Context) *SSEHandler {
+	return &SSEHandler{
+		w:   w,
+		rc:  http.NewResponseController(w),
+		ctx: ctx,
+	}
+}
+
+// SetupSSE configures the response headers and deadline for SSE streaming
+func (h *SSEHandler) SetupSSE() error {
+	// Reset write deadline for streaming to prevent timeouts
+	if err := h.rc.SetWriteDeadline(time.Time{}); err != nil {
+		log.Printf("failed to reset write deadline for streaming: %v", err)
+		return err
+	}
+
+	// Set SSE headers
+	h.w.Header().Set("Content-Type", SSEContentType)
+	h.w.Header().Set("Cache-Control", "no-cache, no-store, must-revalidate")
+	h.w.Header().Set("Connection", SSEConnection)
+	h.w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
+	h.w.Header().Set("X-Accel-Buffering", "no")       // Disable nginx buffering
+	h.w.Header().Set("Cache-Control", "no-transform") // Prevent proxy transformation
+
+	// Send headers and establish streaming
+	h.w.WriteHeader(http.StatusOK)
+	fmt.Fprint(h.w, SSEStreamStartMsg)
+	return h.flush()
+}
+
+// StartKeepalive begins sending periodic keepalive messages
+func (h *SSEHandler) StartKeepalive() {
+	if h.keepaliveTicker != nil {
+		return // Already started
+	}
+
+	h.keepaliveTicker = time.NewTicker(1 * time.Second)
+	h.done = make(chan bool)
+
+	go func() {
+		defer func() {
+			if h.keepaliveTicker != nil {
+				h.keepaliveTicker.Stop()
+			}
+		}()
+
+		for {
+			select {
+			case <-h.keepaliveTicker.C:
+				fmt.Fprint(h.w, SSEKeepaliveMsg)
+				h.flush()
+			case <-h.done:
+				return
+			case <-h.ctx.Done():
+				return
+			}
+		}
+	}()
+}
+
+// StopKeepalive stops sending keepalive messages
+func (h *SSEHandler) StopKeepalive() {
+	if h.keepaliveTicker != nil {
+		h.keepaliveTicker.Stop()
+		h.keepaliveTicker = nil
+	}
+	if h.done != nil {
+		close(h.done)
+		h.done = nil
+	}
+}
+
+// WriteData writes data in SSE format with proper formatting and flushing
+func (h *SSEHandler) WriteData(data string) error {
+	if h.closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	_, err := fmt.Fprintf(h.w, "data: %s\n\n", data)
+	if err != nil {
+		return err
+	}
+	return h.flush()
+}
+
+// WriteJsonData marshals the given data to JSON and writes it in SSE format
+func (h *SSEHandler) WriteJsonData(data interface{}) error {
+	if h.closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	jsonData, err := json.Marshal(data)
+	if err != nil {
+		return fmt.Errorf("failed to marshal JSON: %v", err)
+	}
+	return h.WriteData(string(jsonData))
+}
+
+// WriteError writes an error message in SSE format and sends the done signal
+func (h *SSEHandler) WriteError(errorMsg string) error {
+	if h.closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	errorResp := map[string]interface{}{
+		"type":      "error",
+		"errorText": errorMsg,
+	}
+	if err := h.WriteJsonData(errorResp); err != nil {
+		return err
+	}
+	return h.WriteDone()
+}
+
+// WriteEvent writes an SSE event with optional event type
+func (h *SSEHandler) WriteEvent(eventType, data string) error {
+	if h.closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	if eventType != "" {
+		fmt.Fprintf(h.w, "event: %s\n", eventType)
+	}
+	fmt.Fprintf(h.w, "data: %s\n\n", data)
+	return h.flush()
+}
+
+// WriteComment writes an SSE comment (for keepalive or debugging)
+func (h *SSEHandler) WriteComment(comment string) error {
+	if h.closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	_, err := fmt.Fprintf(h.w, ": %s\n\n", comment)
+	if err != nil {
+		return err
+	}
+	return h.flush()
+}
+
+// WriteDone sends the standard SSE done message and closes the handler
+func (h *SSEHandler) WriteDone() error {
+	if h.closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	err := h.WriteData("[DONE]")
+	h.Close()
+	return err
+}
+
+// flush attempts to flush the response writer
+func (h *SSEHandler) flush() error {
+	if err := h.rc.Flush(); err != nil {
+		// client closed connection, or flush not supported
+		return err
+	}
+	return nil
+}
+
+// Close stops keepalive and cleans up resources
+func (h *SSEHandler) Close() {
+	if h.closed {
+		return
+	}
+	h.closed = true
+	h.StopKeepalive()
+}
\ No newline at end of file
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index 2178bc2bb2..b63b2c9bb4 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -10,10 +10,8 @@ import (
 	"encoding/json"
 	"fmt"
 	"io"
-	"log"
 	"net/http"
 	"strings"
-	"time"
 
 	openaiapi "github.com/sashabaranov/go-openai"
 	"github.com/wavetermdev/waveterm/pkg/waveobj"
@@ -261,30 +259,10 @@ func convertUseChatMessagesToPrompt(messages []UseChatMessage) []wshrpc.WaveAIPr
 	return prompt
 }
 
-func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
-	// Set up keepalive ticker immediately
-	keepaliveTicker := time.NewTicker(1 * time.Second)
-	defer keepaliveTicker.Stop()
-
-	// Create a channel to signal when streaming is done
-	done := make(chan bool)
-	defer close(done)
-
-	// Start keepalive goroutine immediately
-	go func() {
-		for {
-			select {
-			case <-keepaliveTicker.C:
-				// Send SSE keepalive comment
-				fmt.Fprintf(w, ": keepalive\n\n")
-				tryFlush(w)
-			case <-done:
-				return
-			case <-ctx.Done():
-				return
-			}
-		}
-	}()
+func streamOpenAIToUseChat(sseHandler *SSEHandler, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+	// Start keepalive
+	sseHandler.StartKeepalive()
+	defer sseHandler.StopKeepalive()
 
 	// Set up OpenAI client
 	clientConfig := openaiapi.DefaultConfig(opts.APIToken)
@@ -332,9 +310,7 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 	// Create stream
 	stream, err := client.CreateChatCompletionStream(ctx, req)
 	if err != nil {
-		// Send error in SSE format since headers are already sent
-		writeUseChatError(w, fmt.Sprintf("OpenAI API error: %v", err))
-		done <- true
+		sseHandler.WriteError(fmt.Sprintf("OpenAI API error: %v", err))
 		return
 	}
 	defer stream.Close()
@@ -344,8 +320,7 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 	textId := generateID()
 
 	// Send message start
-	writeMessageStart(w, messageId)
-	tryFlush(w)
+	writeMessageStart(sseHandler, messageId)
 
 	// Track whether we've started text streaming
 	textStarted := false
@@ -357,18 +332,15 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 		if err == io.EOF {
 			// Send text end and finish if text was started but not ended
 			if textStarted && !textEnded {
-				writeTextEnd(w, textId)
+				writeTextEnd(sseHandler, textId)
 				textEnded = true
 			}
-			writeOpenAIFinish(w, "stop", nil)
-			writeUseChatDone(w)
-			done <- true
+			writeOpenAIFinish(sseHandler, "stop", nil)
+			sseHandler.WriteDone()
 			return
 		}
 		if err != nil {
-			// Send error in SSE format since headers are already sent
-			writeUseChatError(w, fmt.Sprintf("Stream error: %v", err))
-			done <- true
+			sseHandler.WriteError(fmt.Sprintf("Stream error: %v", err))
 			return
 		}
 
@@ -377,10 +349,10 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 			if choice.Delta.Content != "" {
 				// Send text start only when we have actual content
 				if !textStarted {
-					writeTextStart(w, textId)
+					writeTextStart(sseHandler, textId)
 					textStarted = true
 				}
-				writeUseChatTextDelta(w, textId, choice.Delta.Content)
+				writeUseChatTextDelta(sseHandler, textId, choice.Delta.Content)
 			}
 			if choice.FinishReason != "" {
 				usage := &OpenAIUsageResponse{}
@@ -390,86 +362,53 @@ func streamOpenAIToUseChat(w http.ResponseWriter, ctx context.Context, opts *wsh
 					usage.TotalTokens = response.Usage.TotalTokens
 				}
 				if textStarted && !textEnded {
-					writeTextEnd(w, textId)
+					writeTextEnd(sseHandler, textId)
 					textEnded = true
 				}
-				writeOpenAIFinish(w, string(choice.FinishReason), usage)
+				writeOpenAIFinish(sseHandler, string(choice.FinishReason), usage)
 			}
 		}
-
-		// Flush the response
-		tryFlush(w)
 	}
 }
 
-func writeMessageStart(w http.ResponseWriter, messageId string) {
+func writeMessageStart(sseHandler *SSEHandler, messageId string) {
 	resp := map[string]interface{}{
 		"type":      "start",
 		"messageId": messageId,
 	}
-	data, _ := json.Marshal(resp)
-	fmt.Fprintf(w, "data: %s\n\n", data)
-	tryFlush(w)
+	sseHandler.WriteJsonData(resp)
 }
 
-func writeTextStart(w http.ResponseWriter, textId string) {
+func writeTextStart(sseHandler *SSEHandler, textId string) {
 	resp := map[string]interface{}{
 		"type": "text-start",
 		"id":   textId,
 	}
-	data, _ := json.Marshal(resp)
-	fmt.Fprintf(w, "data: %s\n\n", data)
-	tryFlush(w)
+	sseHandler.WriteJsonData(resp)
 }
 
-func writeUseChatTextDelta(w http.ResponseWriter, textId string, text string) {
+func writeUseChatTextDelta(sseHandler *SSEHandler, textId string, text string) {
 	resp := map[string]interface{}{
 		"type":  "text-delta",
 		"id":    textId,
 		"delta": text,
 	}
-	data, _ := json.Marshal(resp)
-	fmt.Fprintf(w, "data: %s\n\n", data)
-	tryFlush(w)
+	sseHandler.WriteJsonData(resp)
 }
 
-func writeTextEnd(w http.ResponseWriter, textId string) {
+func writeTextEnd(sseHandler *SSEHandler, textId string) {
 	resp := map[string]interface{}{
 		"type": "text-end",
 		"id":   textId,
 	}
-	data, _ := json.Marshal(resp)
-	fmt.Fprintf(w, "data: %s\n\n", data)
-	tryFlush(w)
+	sseHandler.WriteJsonData(resp)
 }
 
-func writeOpenAIFinish(w http.ResponseWriter, finishReason string, usage *OpenAIUsageResponse) {
+func writeOpenAIFinish(sseHandler *SSEHandler, finishReason string, usage *OpenAIUsageResponse) {
 	resp := map[string]interface{}{
 		"type": "finish",
 	}
-	data, _ := json.Marshal(resp)
-	fmt.Fprintf(w, "data: %s\n\n", data)
-	tryFlush(w)
-}
-
-func writeUseChatError(w http.ResponseWriter, errorMsg string) {
-	// Send error in SSE format
-	resp := map[string]interface{}{
-		"type":      "error",
-		"errorText": errorMsg,
-	}
-	data, _ := json.Marshal(resp)
-	fmt.Fprintf(w, "data: %s\n\n", data)
-	fmt.Fprintf(w, "data: [DONE]\n\n")
-	tryFlush(w)
-}
-
-func tryFlush(w http.ResponseWriter) {
-	rc := http.NewResponseController(w)
-	if err := rc.Flush(); err != nil {
-		// client closed connection, or flush not supported
-		return
-	}
+	sseHandler.WriteJsonData(resp)
 }
 
 func generateID() string {
@@ -478,11 +417,6 @@ func generateID() string {
 	return hex.EncodeToString(bytes)
 }
 
-func writeUseChatDone(w http.ResponseWriter) {
-	fmt.Fprintf(w, "data: [DONE]\n\n")
-	tryFlush(w)
-}
-
 func HandleAIChat(w http.ResponseWriter, r *http.Request) {
 	// Handle CORS preflight requests
 	if r.Method == http.MethodOptions {
@@ -530,25 +464,15 @@ func HandleAIChat(w http.ResponseWriter, r *http.Request) {
 		return
 	}
 
-	// Reset write deadline for streaming to prevent timeouts
-	rc := http.NewResponseController(w)
-	if err := rc.SetWriteDeadline(time.Time{}); err != nil {
-		log.Printf("failed to reset write deadline for streaming: %v", err)
-	}
-
-	// NOW set SSE headers after all validation and body parsing is complete
-	w.Header().Set("Content-Type", UseChatContentTypeSSE)
-	w.Header().Set("Cache-Control", "no-cache, no-store, must-revalidate")
-	w.Header().Set("Connection", UseChatConnection)
-	w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
-	w.Header().Set("X-Accel-Buffering", "no")       // Disable nginx buffering
-	w.Header().Set("Cache-Control", "no-transform") // Prevent proxy transformation
+	// Create SSE handler and set up streaming
+	sseHandler := MakeSSEHandler(w, r.Context())
+	defer sseHandler.Close()
 
-	// Send headers and a tiny first chunk to establish streaming
-	w.WriteHeader(http.StatusOK)
-	fmt.Fprintf(w, ": stream-start\n\n") // Send initial SSE comment
-	tryFlush(w)
+	if err := sseHandler.SetupSSE(); err != nil {
+		http.Error(w, fmt.Sprintf("Failed to setup SSE: %v", err), http.StatusInternalServerError)
+		return
+	}
 
 	// Stream OpenAI response
-	streamOpenAIToUseChat(w, r.Context(), aiOpts, req.Messages)
+	streamOpenAIToUseChat(sseHandler, r.Context(), aiOpts, req.Messages)
 }

From 6c3575a965388228bddae67ca54d85ccaa60b9c9 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 11:23:21 -0700
Subject: [PATCH 14/29] only send one finish

---
 pkg/waveai/usechat.go | 12 ++++++++----
 1 file changed, 8 insertions(+), 4 deletions(-)

diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index b63b2c9bb4..7c401b890c 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -322,20 +322,23 @@ func streamOpenAIToUseChat(sseHandler *SSEHandler, ctx context.Context, opts *ws
 	// Send message start
 	writeMessageStart(sseHandler, messageId)
 
-	// Track whether we've started text streaming
+	// Track whether we've started text streaming and finished
 	textStarted := false
 	textEnded := false
+	finished := false
 
 	// Stream responses
 	for {
 		response, err := stream.Recv()
 		if err == io.EOF {
-			// Send text end and finish if text was started but not ended
+			// Send text end and finish if text was started but not ended, and we haven't finished yet
 			if textStarted && !textEnded {
 				writeTextEnd(sseHandler, textId)
 				textEnded = true
 			}
-			writeOpenAIFinish(sseHandler, "stop", nil)
+			if !finished {
+				writeOpenAIFinish(sseHandler, "stop", nil)
+			}
 			sseHandler.WriteDone()
 			return
 		}
@@ -354,7 +357,7 @@ func streamOpenAIToUseChat(sseHandler *SSEHandler, ctx context.Context, opts *ws
 				}
 				writeUseChatTextDelta(sseHandler, textId, choice.Delta.Content)
 			}
-			if choice.FinishReason != "" {
+			if choice.FinishReason != "" && !finished {
 				usage := &OpenAIUsageResponse{}
 				if response.Usage != nil && response.Usage.PromptTokens > 0 {
 					usage.PromptTokens = response.Usage.PromptTokens
@@ -366,6 +369,7 @@ func streamOpenAIToUseChat(sseHandler *SSEHandler, ctx context.Context, opts *ws
 					textEnded = true
 				}
 				writeOpenAIFinish(sseHandler, string(choice.FinishReason), usage)
+				finished = true
 			}
 		}
 	}

From ed63d4ec36a5e7b7b0a3e94060b493534a9256c0 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 12:18:04 -0700
Subject: [PATCH 15/29] backend updates, more robust sse support

---
 go.mod                     |   1 -
 go.sum                     |   2 -
 pkg/waveai/ssehandler.go   | 195 -----------------------
 pkg/waveai/ssehandlerch.go | 308 +++++++++++++++++++++++++++++++++++++
 pkg/waveai/usechat.go      |  38 +----
 staticcheck.conf           |   2 +-
 6 files changed, 316 insertions(+), 230 deletions(-)
 delete mode 100644 pkg/waveai/ssehandler.go
 create mode 100644 pkg/waveai/ssehandlerch.go

diff --git a/go.mod b/go.mod
index 2d6855d1b1..171fb0ef9b 100644
--- a/go.mod
+++ b/go.mod
@@ -15,7 +15,6 @@ require (
 	github.com/golang-migrate/migrate/v4 v4.18.3
 	github.com/google/generative-ai-go v0.20.1
 	github.com/google/uuid v1.6.0
-	github.com/gorilla/handlers v1.5.2
 	github.com/gorilla/mux v1.8.1
 	github.com/gorilla/websocket v1.5.3
 	github.com/invopop/jsonschema v0.13.0
diff --git a/go.sum b/go.sum
index 2eb53712b7..2c110b35aa 100644
--- a/go.sum
+++ b/go.sum
@@ -96,8 +96,6 @@ github.com/googleapis/enterprise-certificate-proxy v0.3.6 h1:GW/XbdyBFQ8Qe+YAmFU
 github.com/googleapis/enterprise-certificate-proxy v0.3.6/go.mod h1:MkHOF77EYAE7qfSuSS9PU6g4Nt4e11cnsDUowfwewLA=
 github.com/googleapis/gax-go/v2 v2.15.0 h1:SyjDc1mGgZU5LncH8gimWo9lW1DtIfPibOG81vgd/bo=
 github.com/googleapis/gax-go/v2 v2.15.0/go.mod h1:zVVkkxAQHa1RQpg9z2AUCMnKhi0Qld9rcmyfL1OZhoc=
-github.com/gorilla/handlers v1.5.2 h1:cLTUSsNkgcwhgRqvCNmdbRWG0A3N4F+M2nWKdScwyEE=
-github.com/gorilla/handlers v1.5.2/go.mod h1:dX+xVpaxdSw+q0Qek8SSsl3dfMk3jNddUkMzo0GtH0w=
 github.com/gorilla/mux v1.8.1 h1:TuBL49tXwgrFYWhqrNgrUNEY92u81SPhu7sTdzQEiWY=
 github.com/gorilla/mux v1.8.1/go.mod h1:AKf9I4AEqPTmMytcMc0KkNouC66V3BtZ4qD5fmWSiMQ=
 github.com/gorilla/websocket v1.5.3 h1:saDtZ6Pbx/0u+bgYQ3q96pZgCzfhKXGPqt7kZ72aNNg=
diff --git a/pkg/waveai/ssehandler.go b/pkg/waveai/ssehandler.go
deleted file mode 100644
index c597a57542..0000000000
--- a/pkg/waveai/ssehandler.go
+++ /dev/null
@@ -1,195 +0,0 @@
-// Copyright 2025, Command Line Inc.
-// SPDX-License-Identifier: Apache-2.0
-
-package waveai
-
-import (
-	"context"
-	"encoding/json"
-	"fmt"
-	"log"
-	"net/http"
-	"time"
-)
-
-const (
-	SSEContentType    = "text/event-stream"
-	SSECacheControl   = "no-cache"
-	SSEConnection     = "keep-alive"
-	SSEKeepaliveMsg   = ": keepalive\n\n"
-	SSEStreamStartMsg = ": stream-start\n\n"
-)
-
-// SSEHandler wraps an http.ResponseWriter to provide Server-Sent Events functionality
-type SSEHandler struct {
-	w               http.ResponseWriter
-	rc              *http.ResponseController
-	keepaliveTicker *time.Ticker
-	done            chan bool
-	ctx             context.Context
-	closed          bool
-}
-
-// MakeSSEHandler creates a new SSE handler wrapping the given ResponseWriter
-func MakeSSEHandler(w http.ResponseWriter, ctx context.Context) *SSEHandler {
-	return &SSEHandler{
-		w:   w,
-		rc:  http.NewResponseController(w),
-		ctx: ctx,
-	}
-}
-
-// SetupSSE configures the response headers and deadline for SSE streaming
-func (h *SSEHandler) SetupSSE() error {
-	// Reset write deadline for streaming to prevent timeouts
-	if err := h.rc.SetWriteDeadline(time.Time{}); err != nil {
-		log.Printf("failed to reset write deadline for streaming: %v", err)
-		return err
-	}
-
-	// Set SSE headers
-	h.w.Header().Set("Content-Type", SSEContentType)
-	h.w.Header().Set("Cache-Control", "no-cache, no-store, must-revalidate")
-	h.w.Header().Set("Connection", SSEConnection)
-	h.w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
-	h.w.Header().Set("X-Accel-Buffering", "no")       // Disable nginx buffering
-	h.w.Header().Set("Cache-Control", "no-transform") // Prevent proxy transformation
-
-	// Send headers and establish streaming
-	h.w.WriteHeader(http.StatusOK)
-	fmt.Fprint(h.w, SSEStreamStartMsg)
-	return h.flush()
-}
-
-// StartKeepalive begins sending periodic keepalive messages
-func (h *SSEHandler) StartKeepalive() {
-	if h.keepaliveTicker != nil {
-		return // Already started
-	}
-
-	h.keepaliveTicker = time.NewTicker(1 * time.Second)
-	h.done = make(chan bool)
-
-	go func() {
-		defer func() {
-			if h.keepaliveTicker != nil {
-				h.keepaliveTicker.Stop()
-			}
-		}()
-
-		for {
-			select {
-			case <-h.keepaliveTicker.C:
-				fmt.Fprint(h.w, SSEKeepaliveMsg)
-				h.flush()
-			case <-h.done:
-				return
-			case <-h.ctx.Done():
-				return
-			}
-		}
-	}()
-}
-
-// StopKeepalive stops sending keepalive messages
-func (h *SSEHandler) StopKeepalive() {
-	if h.keepaliveTicker != nil {
-		h.keepaliveTicker.Stop()
-		h.keepaliveTicker = nil
-	}
-	if h.done != nil {
-		close(h.done)
-		h.done = nil
-	}
-}
-
-// WriteData writes data in SSE format with proper formatting and flushing
-func (h *SSEHandler) WriteData(data string) error {
-	if h.closed {
-		return fmt.Errorf("SSE handler is closed")
-	}
-	_, err := fmt.Fprintf(h.w, "data: %s\n\n", data)
-	if err != nil {
-		return err
-	}
-	return h.flush()
-}
-
-// WriteJsonData marshals the given data to JSON and writes it in SSE format
-func (h *SSEHandler) WriteJsonData(data interface{}) error {
-	if h.closed {
-		return fmt.Errorf("SSE handler is closed")
-	}
-	jsonData, err := json.Marshal(data)
-	if err != nil {
-		return fmt.Errorf("failed to marshal JSON: %v", err)
-	}
-	return h.WriteData(string(jsonData))
-}
-
-// WriteError writes an error message in SSE format and sends the done signal
-func (h *SSEHandler) WriteError(errorMsg string) error {
-	if h.closed {
-		return fmt.Errorf("SSE handler is closed")
-	}
-	errorResp := map[string]interface{}{
-		"type":      "error",
-		"errorText": errorMsg,
-	}
-	if err := h.WriteJsonData(errorResp); err != nil {
-		return err
-	}
-	return h.WriteDone()
-}
-
-// WriteEvent writes an SSE event with optional event type
-func (h *SSEHandler) WriteEvent(eventType, data string) error {
-	if h.closed {
-		return fmt.Errorf("SSE handler is closed")
-	}
-	if eventType != "" {
-		fmt.Fprintf(h.w, "event: %s\n", eventType)
-	}
-	fmt.Fprintf(h.w, "data: %s\n\n", data)
-	return h.flush()
-}
-
-// WriteComment writes an SSE comment (for keepalive or debugging)
-func (h *SSEHandler) WriteComment(comment string) error {
-	if h.closed {
-		return fmt.Errorf("SSE handler is closed")
-	}
-	_, err := fmt.Fprintf(h.w, ": %s\n\n", comment)
-	if err != nil {
-		return err
-	}
-	return h.flush()
-}
-
-// WriteDone sends the standard SSE done message and closes the handler
-func (h *SSEHandler) WriteDone() error {
-	if h.closed {
-		return fmt.Errorf("SSE handler is closed")
-	}
-	err := h.WriteData("[DONE]")
-	h.Close()
-	return err
-}
-
-// flush attempts to flush the response writer
-func (h *SSEHandler) flush() error {
-	if err := h.rc.Flush(); err != nil {
-		// client closed connection, or flush not supported
-		return err
-	}
-	return nil
-}
-
-// Close stops keepalive and cleans up resources
-func (h *SSEHandler) Close() {
-	if h.closed {
-		return
-	}
-	h.closed = true
-	h.StopKeepalive()
-}
\ No newline at end of file
diff --git a/pkg/waveai/ssehandlerch.go b/pkg/waveai/ssehandlerch.go
new file mode 100644
index 0000000000..f8b34792ae
--- /dev/null
+++ b/pkg/waveai/ssehandlerch.go
@@ -0,0 +1,308 @@
+// Copyright 2025, Command Line Inc.
+// SPDX-License-Identifier: Apache-2.0
+
+package waveai
+
+import (
+	"context"
+	"encoding/json"
+	"fmt"
+	"net/http"
+	"sync"
+	"time"
+)
+
+const (
+	SSEContentType        = "text/event-stream"
+	SSECacheControl       = "no-cache"
+	SSEConnection         = "keep-alive"
+	SSEKeepaliveMsg       = ": keepalive\n\n"
+	SSEStreamStartMsg     = ": stream-start\n\n"
+	SSEKeepaliveInterval  = 1 * time.Second
+)
+
+// SSEMessageType represents the type of message to write
+type SSEMessageType string
+
+const (
+	SSEMsgData    SSEMessageType = "data"
+	SSEMsgEvent   SSEMessageType = "event"
+	SSEMsgComment SSEMessageType = "comment"
+	SSEMsgError   SSEMessageType = "error"
+)
+
+// SSEMessage represents a message to be written to the SSE stream
+type SSEMessage struct {
+	Type      SSEMessageType
+	Data      string
+	EventType string // Only used for SSEMsgEvent
+}
+
+// SSEHandlerCh provides channel-based Server-Sent Events functionality
+type SSEHandlerCh struct {
+	w       http.ResponseWriter
+	rc      *http.ResponseController
+	ctx     context.Context
+	writeCh chan SSEMessage
+	errCh   chan error
+	
+	mu     sync.RWMutex
+	closed bool
+	err    error
+	
+	wg sync.WaitGroup
+}
+
+// MakeSSEHandlerCh creates a new channel-based SSE handler
+func MakeSSEHandlerCh(w http.ResponseWriter, ctx context.Context) *SSEHandlerCh {
+	return &SSEHandlerCh{
+		w:       w,
+		rc:      http.NewResponseController(w),
+		ctx:     ctx,
+		writeCh: make(chan SSEMessage, 10), // Buffered to prevent blocking
+		errCh:   make(chan error, 1),       // Buffered for single error
+	}
+}
+
+// SetupSSE configures the response headers and starts the writer goroutine
+func (h *SSEHandlerCh) SetupSSE() error {
+	h.mu.Lock()
+	defer h.mu.Unlock()
+	
+	if h.closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	
+	// Reset write deadline for streaming
+	if err := h.rc.SetWriteDeadline(time.Time{}); err != nil {
+		return fmt.Errorf("failed to reset write deadline: %v", err)
+	}
+	
+	// Set SSE headers
+	h.w.Header().Set("Content-Type", SSEContentType)
+	h.w.Header().Set("Cache-Control", "no-cache, no-store, must-revalidate")
+	h.w.Header().Set("Connection", SSEConnection)
+	h.w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
+	h.w.Header().Set("X-Accel-Buffering", "no")
+	h.w.Header().Set("Cache-Control", "no-transform")
+	
+	// Send headers and establish streaming
+	h.w.WriteHeader(http.StatusOK)
+	fmt.Fprint(h.w, SSEStreamStartMsg)
+	if err := h.flush(); err != nil {
+		return err
+	}
+	
+	// Start the writer goroutine
+	h.wg.Add(1)
+	go h.writerLoop()
+	
+	return nil
+}
+
+// writerLoop handles all writes and keepalives in a single goroutine
+func (h *SSEHandlerCh) writerLoop() {
+	defer h.wg.Done()
+	
+	keepaliveTicker := time.NewTicker(SSEKeepaliveInterval)
+	defer keepaliveTicker.Stop()
+	
+	for {
+		select {
+		case msg, ok := <-h.writeCh:
+			if !ok {
+				// Channel closed, send [DONE] and exit
+				h.writeDirectly("[DONE]", SSEMsgData)
+				return
+			}
+			
+			if err := h.writeMessage(msg); err != nil {
+				h.setError(err)
+				return
+			}
+			
+		case <-keepaliveTicker.C:
+			if err := h.writeDirectly("keepalive", SSEMsgComment); err != nil {
+				h.setError(err)
+				return
+			}
+			
+		case <-h.ctx.Done():
+			return
+		}
+	}
+}
+
+// writeMessage writes a message to the SSE stream
+func (h *SSEHandlerCh) writeMessage(msg SSEMessage) error {
+	switch msg.Type {
+	case SSEMsgData:
+		return h.writeDirectly(msg.Data, SSEMsgData)
+	case SSEMsgEvent:
+		return h.writeEvent(msg.EventType, msg.Data)
+	case SSEMsgComment:
+		return h.writeDirectly(msg.Data, SSEMsgComment)
+	case SSEMsgError:
+		return h.writeDirectly(msg.Data, SSEMsgData)
+	default:
+		return fmt.Errorf("unknown message type: %s", msg.Type)
+	}
+}
+
+// writeDirectly writes data directly to the response writer
+func (h *SSEHandlerCh) writeDirectly(data string, msgType SSEMessageType) error {
+	switch msgType {
+	case SSEMsgData:
+		_, err := fmt.Fprintf(h.w, "data: %s\n\n", data)
+		if err != nil {
+			return err
+		}
+	case SSEMsgComment:
+		_, err := fmt.Fprintf(h.w, ": %s\n\n", data)
+		if err != nil {
+			return err
+		}
+	default:
+		return fmt.Errorf("unsupported direct write type: %s", msgType)
+	}
+	return h.flush()
+}
+
+// writeEvent writes an SSE event with optional event type
+func (h *SSEHandlerCh) writeEvent(eventType, data string) error {
+	if eventType != "" {
+		if _, err := fmt.Fprintf(h.w, "event: %s\n", eventType); err != nil {
+			return err
+		}
+	}
+	if _, err := fmt.Fprintf(h.w, "data: %s\n\n", data); err != nil {
+		return err
+	}
+	return h.flush()
+}
+
+// flush attempts to flush the response writer
+func (h *SSEHandlerCh) flush() error {
+	return h.rc.Flush()
+}
+
+// setError sets the error state thread-safely
+func (h *SSEHandlerCh) setError(err error) {
+	h.mu.Lock()
+	defer h.mu.Unlock()
+	
+	if h.err == nil {
+		h.err = err
+		// Send error to error channel if there's space
+		select {
+		case h.errCh <- err:
+		default:
+		}
+	}
+}
+
+// WriteData queues data to be written in SSE format
+func (h *SSEHandlerCh) WriteData(data string) error {
+	h.mu.RLock()
+	closed := h.closed
+	h.mu.RUnlock()
+	
+	if closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	
+	select {
+	case h.writeCh <- SSEMessage{Type: SSEMsgData, Data: data}:
+		return nil
+	case <-h.ctx.Done():
+		return h.ctx.Err()
+	default:
+		return fmt.Errorf("write channel is full")
+	}
+}
+
+// WriteJsonData marshals data to JSON and queues it for writing
+func (h *SSEHandlerCh) WriteJsonData(data interface{}) error {
+	jsonData, err := json.Marshal(data)
+	if err != nil {
+		return fmt.Errorf("failed to marshal JSON: %v", err)
+	}
+	return h.WriteData(string(jsonData))
+}
+
+// WriteError queues an error message and closes the handler
+func (h *SSEHandlerCh) WriteError(errorMsg string) error {
+	errorResp := map[string]interface{}{
+		"type":      "error",
+		"errorText": errorMsg,
+	}
+	if err := h.WriteJsonData(errorResp); err != nil {
+		return err
+	}
+	h.Close()
+	return nil
+}
+
+// WriteEvent queues an SSE event with optional event type
+func (h *SSEHandlerCh) WriteEvent(eventType, data string) error {
+	h.mu.RLock()
+	closed := h.closed
+	h.mu.RUnlock()
+	
+	if closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	
+	select {
+	case h.writeCh <- SSEMessage{Type: SSEMsgEvent, Data: data, EventType: eventType}:
+		return nil
+	case <-h.ctx.Done():
+		return h.ctx.Err()
+	default:
+		return fmt.Errorf("write channel is full")
+	}
+}
+
+// WriteComment queues an SSE comment
+func (h *SSEHandlerCh) WriteComment(comment string) error {
+	h.mu.RLock()
+	closed := h.closed
+	h.mu.RUnlock()
+	
+	if closed {
+		return fmt.Errorf("SSE handler is closed")
+	}
+	
+	select {
+	case h.writeCh <- SSEMessage{Type: SSEMsgComment, Data: comment}:
+		return nil
+	case <-h.ctx.Done():
+		return h.ctx.Err()
+	default:
+		return fmt.Errorf("write channel is full")
+	}
+}
+
+// Err returns any error that occurred during writing
+func (h *SSEHandlerCh) Err() error {
+	h.mu.RLock()
+	defer h.mu.RUnlock()
+	return h.err
+}
+
+// Close closes the write channel, sends [DONE], and cleans up resources
+func (h *SSEHandlerCh) Close() {
+	h.mu.Lock()
+	if h.closed {
+		h.mu.Unlock()
+		return
+	}
+	h.closed = true
+	
+	// Close the write channel, which will trigger [DONE] in writerLoop
+	close(h.writeCh)
+	h.mu.Unlock()
+	
+	// Wait for writer goroutine to finish (without holding the lock)
+	h.wg.Wait()
+}
\ No newline at end of file
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index 7c401b890c..b42dee1e7f 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -20,11 +20,6 @@ import (
 	"github.com/wavetermdev/waveterm/pkg/wstore"
 )
 
-const (
-	UseChatContentTypeSSE = "text/event-stream"
-	UseChatCacheControl   = "no-cache"
-	UseChatConnection     = "keep-alive"
-)
 
 // see /aiprompts/usechat-streamingproto.md for protocol
 
@@ -244,25 +239,7 @@ func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOpti
 	return aiOpts, nil
 }
 
-func convertUseChatMessagesToPrompt(messages []UseChatMessage) []wshrpc.WaveAIPromptMessageType {
-	var prompt []wshrpc.WaveAIPromptMessageType
-	for _, msg := range messages {
-		content := msg.GetContent()
-		if strings.TrimSpace(content) == "" {
-			continue
-		}
-		prompt = append(prompt, wshrpc.WaveAIPromptMessageType{
-			Role:    msg.Role,
-			Content: content,
-		})
-	}
-	return prompt
-}
-
-func streamOpenAIToUseChat(sseHandler *SSEHandler, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
-	// Start keepalive
-	sseHandler.StartKeepalive()
-	defer sseHandler.StopKeepalive()
+func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
 
 	// Set up OpenAI client
 	clientConfig := openaiapi.DefaultConfig(opts.APIToken)
@@ -339,7 +316,6 @@ func streamOpenAIToUseChat(sseHandler *SSEHandler, ctx context.Context, opts *ws
 			if !finished {
 				writeOpenAIFinish(sseHandler, "stop", nil)
 			}
-			sseHandler.WriteDone()
 			return
 		}
 		if err != nil {
@@ -375,7 +351,7 @@ func streamOpenAIToUseChat(sseHandler *SSEHandler, ctx context.Context, opts *ws
 	}
 }
 
-func writeMessageStart(sseHandler *SSEHandler, messageId string) {
+func writeMessageStart(sseHandler *SSEHandlerCh, messageId string) {
 	resp := map[string]interface{}{
 		"type":      "start",
 		"messageId": messageId,
@@ -383,7 +359,7 @@ func writeMessageStart(sseHandler *SSEHandler, messageId string) {
 	sseHandler.WriteJsonData(resp)
 }
 
-func writeTextStart(sseHandler *SSEHandler, textId string) {
+func writeTextStart(sseHandler *SSEHandlerCh, textId string) {
 	resp := map[string]interface{}{
 		"type": "text-start",
 		"id":   textId,
@@ -391,7 +367,7 @@ func writeTextStart(sseHandler *SSEHandler, textId string) {
 	sseHandler.WriteJsonData(resp)
 }
 
-func writeUseChatTextDelta(sseHandler *SSEHandler, textId string, text string) {
+func writeUseChatTextDelta(sseHandler *SSEHandlerCh, textId string, text string) {
 	resp := map[string]interface{}{
 		"type":  "text-delta",
 		"id":    textId,
@@ -400,7 +376,7 @@ func writeUseChatTextDelta(sseHandler *SSEHandler, textId string, text string) {
 	sseHandler.WriteJsonData(resp)
 }
 
-func writeTextEnd(sseHandler *SSEHandler, textId string) {
+func writeTextEnd(sseHandler *SSEHandlerCh, textId string) {
 	resp := map[string]interface{}{
 		"type": "text-end",
 		"id":   textId,
@@ -408,7 +384,7 @@ func writeTextEnd(sseHandler *SSEHandler, textId string) {
 	sseHandler.WriteJsonData(resp)
 }
 
-func writeOpenAIFinish(sseHandler *SSEHandler, finishReason string, usage *OpenAIUsageResponse) {
+func writeOpenAIFinish(sseHandler *SSEHandlerCh, finishReason string, usage *OpenAIUsageResponse) {
 	resp := map[string]interface{}{
 		"type": "finish",
 	}
@@ -469,7 +445,7 @@ func HandleAIChat(w http.ResponseWriter, r *http.Request) {
 	}
 
 	// Create SSE handler and set up streaming
-	sseHandler := MakeSSEHandler(w, r.Context())
+	sseHandler := MakeSSEHandlerCh(w, r.Context())
 	defer sseHandler.Close()
 
 	if err := sseHandler.SetupSSE(); err != nil {
diff --git a/staticcheck.conf b/staticcheck.conf
index 6ab1cac1af..23487ed228 100644
--- a/staticcheck.conf
+++ b/staticcheck.conf
@@ -1,2 +1,2 @@
-checks = ["all", "-ST1005", "-QF1003", "-ST1000", "-ST1003", "-ST1020"]
+checks = ["all", "-ST1005", "-QF1003", "-ST1000", "-ST1003", "-ST1020", "-ST1021"]
 

From 53adda244e0b37967d6c904af5ac7559de93caa8 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 12:19:35 -0700
Subject: [PATCH 16/29] fix typing indicator

---
 frontend/app/view/waveai/waveaiusechat.tsx | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/frontend/app/view/waveai/waveaiusechat.tsx b/frontend/app/view/waveai/waveaiusechat.tsx
index 4fe9f9ea7e..48cfc55b1d 100644
--- a/frontend/app/view/waveai/waveaiusechat.tsx
+++ b/frontend/app/view/waveai/waveaiusechat.tsx
@@ -541,7 +541,7 @@ const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
         },
     });
 
-    const isLoading = status === "streaming" || status === "submitted";
+    const isLoading = status === "submitted";
 
     const handleInputChange = useCallback((e: React.ChangeEvent<HTMLTextAreaElement>) => {
         setInput(e.target.value);

From 5eaf0e61a66999f318fbc2009dbc20d5fde246fe Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 12:47:06 -0700
Subject: [PATCH 17/29] better fetching of AI opts

---
 pkg/waveai/usechat.go         | 153 ++++++++++------------------------
 pkg/wconfig/settingsconfig.go |  85 +++++++++++++++++++
 2 files changed, 128 insertions(+), 110 deletions(-)

diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index b42dee1e7f..ee977141dc 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -10,6 +10,7 @@ import (
 	"encoding/json"
 	"fmt"
 	"io"
+	"log"
 	"net/http"
 	"strings"
 
@@ -20,7 +21,6 @@ import (
 	"github.com/wavetermdev/waveterm/pkg/wstore"
 )
 
-
 // see /aiprompts/usechat-streamingproto.md for protocol
 
 type UseChatMessagePart struct {
@@ -52,8 +52,8 @@ func (m *UseChatMessage) GetContent() string {
 }
 
 type UseChatRequest struct {
-	Messages []UseChatMessage `json:"messages"`
-	Options  map[string]any   `json:"options,omitempty"`
+	Messages []UseChatMessage        `json:"messages"`
+	Options  *wconfig.AiSettingsType `json:"options,omitempty"`
 }
 
 // OpenAI Chat Completion streaming response format
@@ -80,7 +80,7 @@ type OpenAIUsageResponse struct {
 	TotalTokens      int `json:"total_tokens"`
 }
 
-func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOptions map[string]any) (*wshrpc.WaveAIOptsType, error) {
+func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOptions *wconfig.AiSettingsType) (*wshrpc.WaveAIOptsType, error) {
 	// Get block metadata
 	block, err := wstore.DBMustGet[*waveobj.Block](ctx, blockId)
 	if err != nil {
@@ -89,6 +89,7 @@ func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOpti
 
 	// Get global settings
 	fullConfig := wconfig.GetWatcher().GetFullConfig()
+	globalAiSettings := fullConfig.Settings.GetAiSettings()
 
 	// Resolve preset hierarchy
 	finalPreset := presetKey
@@ -98,18 +99,15 @@ func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOpti
 		}
 	}
 	if finalPreset == "" {
-		if globalPreset := fullConfig.Settings.AiPreset; globalPreset != "" {
-			finalPreset = globalPreset
-		}
+		finalPreset = globalAiSettings.AiPreset
 	}
 	if finalPreset == "" {
 		finalPreset = "default"
 	}
 
 	// Load preset configuration
-	var presetConfig map[string]any
+	var presetAiSettings *wconfig.AiSettingsType
 	if finalPreset != "default" {
-		// Check if preset already has ai@ prefix
 		var presetKey string
 		if strings.HasPrefix(finalPreset, "ai@") {
 			presetKey = finalPreset
@@ -117,117 +115,43 @@ func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOpti
 			presetKey = fmt.Sprintf("ai@%s", finalPreset)
 		}
 		if preset, ok := fullConfig.Presets[presetKey]; ok {
-			presetConfig = preset
-		}
-	}
-
-	// Build AI options with hierarchy: global < preset < block < request
-	aiOpts := &wshrpc.WaveAIOptsType{}
-
-	// Helper function to get string value from hierarchy
-	getString := func(key string) string {
-		// Request options (highest priority)
-		if val, ok := requestOptions[key]; ok {
-			if str, ok := val.(string); ok {
-				return str
+			presetAiSettings = &wconfig.AiSettingsType{}
+			if err := json.Unmarshal(mustMarshal(preset), presetAiSettings); err == nil {
+				// Successfully unmarshaled preset
+			} else {
+				presetAiSettings = nil
 			}
 		}
-		// Block metadata
-		if block != nil && block.Meta != nil {
-			if val, ok := block.Meta[key]; ok {
-				if str, ok := val.(string); ok {
-					return str
-				}
-			}
-		}
-		// Preset config
-		if presetConfig != nil {
-			if val, ok := presetConfig[key]; ok {
-				if str, ok := val.(string); ok {
-					return str
-				}
-			}
-		}
-		// Global settings - use struct fields
-		switch key {
-		case "ai:preset":
-			return fullConfig.Settings.AiPreset
-		case "ai:apitype":
-			return fullConfig.Settings.AiApiType
-		case "ai:apitoken":
-			return fullConfig.Settings.AiApiToken
-		case "ai:baseurl":
-			return fullConfig.Settings.AiBaseURL
-		case "ai:model":
-			return fullConfig.Settings.AiModel
-		case "ai:orgid":
-			return fullConfig.Settings.AiOrgID
-		case "ai:apiversion":
-			return fullConfig.Settings.AIApiVersion
-		case "ai:proxyurl":
-			return fullConfig.Settings.AiProxyUrl
-		}
-		return ""
 	}
 
-	// Helper function to get int value from hierarchy
-	getInt := func(key string) int {
-		// Request options (highest priority)
-		if val, ok := requestOptions[key]; ok {
-			if num, ok := val.(float64); ok {
-				return int(num)
-			}
-			if num, ok := val.(int); ok {
-				return num
-			}
+	// Extract block AI settings from metadata
+	var blockAiSettings *wconfig.AiSettingsType
+	if block != nil && block.Meta != nil {
+		blockAiSettings = &wconfig.AiSettingsType{}
+		if err := json.Unmarshal(mustMarshal(block.Meta), blockAiSettings); err != nil {
+			blockAiSettings = nil
 		}
-		// Block metadata
-		if block != nil && block.Meta != nil {
-			if val, ok := block.Meta[key]; ok {
-				if num, ok := val.(float64); ok {
-					return int(num)
-				}
-				if num, ok := val.(int); ok {
-					return num
-				}
-			}
-		}
-		// Preset config
-		if presetConfig != nil {
-			if val, ok := presetConfig[key]; ok {
-				if num, ok := val.(float64); ok {
-					return int(num)
-				}
-				if num, ok := val.(int); ok {
-					return num
-				}
-			}
-		}
-		// Global settings - use struct fields
-		switch key {
-		case "ai:maxtokens":
-			return int(fullConfig.Settings.AiMaxTokens)
-		case "ai:timeoutms":
-			return int(fullConfig.Settings.AiTimeoutMs)
-		}
-		return 0
 	}
 
-	// Populate AI options
-	aiOpts.Model = getString("ai:model")
-	aiOpts.APIType = getString("ai:apitype")
-	aiOpts.APIToken = getString("ai:apitoken")
-	aiOpts.BaseURL = getString("ai:baseurl")
-	aiOpts.OrgID = getString("ai:orgid")
-	aiOpts.APIVersion = getString("ai:apiversion")
-	aiOpts.ProxyURL = getString("ai:proxyurl")
-	aiOpts.MaxTokens = getInt("ai:maxtokens")
-	aiOpts.MaxChoices = getInt("ai:maxchoices")
-	aiOpts.TimeoutMs = getInt("ai:timeoutms")
+	// Merge settings with hierarchy: global < preset < block < request
+	finalSettings := wconfig.MergeAiSettings(globalAiSettings, presetAiSettings, blockAiSettings, requestOptions)
+
+	// Convert to WaveAIOptsType
+	aiOpts := &wshrpc.WaveAIOptsType{
+		Model:      finalSettings.AiModel,
+		APIType:    finalSettings.AiApiType,
+		APIToken:   finalSettings.AiApiToken,
+		BaseURL:    finalSettings.AiBaseURL,
+		OrgID:      finalSettings.AiOrgID,
+		APIVersion: finalSettings.AIApiVersion,
+		ProxyURL:   finalSettings.AiProxyUrl,
+		MaxTokens:  int(finalSettings.AiMaxTokens),
+		TimeoutMs:  int(finalSettings.AiTimeoutMs),
+	}
 
 	// Set defaults
 	if aiOpts.Model == "" {
-		aiOpts.Model = "gpt-4"
+		aiOpts.Model = "gpt-4.1"
 	}
 	if aiOpts.APIType == "" {
 		aiOpts.APIType = APIType_OpenAI
@@ -239,6 +163,14 @@ func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOpti
 	return aiOpts, nil
 }
 
+func mustMarshal(v any) []byte {
+	data, err := json.Marshal(v)
+	if err != nil {
+		return []byte("{}")
+	}
+	return data
+}
+
 func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
 
 	// Set up OpenAI client
@@ -432,6 +364,7 @@ func HandleAIChat(w http.ResponseWriter, r *http.Request) {
 		http.Error(w, "No AI model specified", http.StatusBadRequest)
 		return
 	}
+	log.Printf("using AI model: %s (%s)", aiOpts.Model, aiOpts.BaseURL)
 
 	// For now, only support OpenAI
 	if aiOpts.APIType != APIType_OpenAI && aiOpts.APIType != "" {
diff --git a/pkg/wconfig/settingsconfig.go b/pkg/wconfig/settingsconfig.go
index e926689abf..b041233324 100644
--- a/pkg/wconfig/settingsconfig.go
+++ b/pkg/wconfig/settingsconfig.go
@@ -141,6 +141,91 @@ type SettingsType struct {
 	ConnWshEnabled          bool  `json:"conn:wshenabled,omitempty"`
 }
 
+func (s *SettingsType) GetAiSettings() *AiSettingsType {
+	return &AiSettingsType{
+		AiClear:         s.AiClear,
+		AiPreset:        s.AiPreset,
+		AiApiType:       s.AiApiType,
+		AiBaseURL:       s.AiBaseURL,
+		AiApiToken:      s.AiApiToken,
+		AiName:          s.AiName,
+		AiModel:         s.AiModel,
+		AiOrgID:         s.AiOrgID,
+		AIApiVersion:    s.AIApiVersion,
+		AiMaxTokens:     s.AiMaxTokens,
+		AiTimeoutMs:     s.AiTimeoutMs,
+		AiProxyUrl:      s.AiProxyUrl,
+		AiFontSize:      s.AiFontSize,
+		AiFixedFontSize: s.AiFixedFontSize,
+	}
+}
+
+func MergeAiSettings(settings ...*AiSettingsType) *AiSettingsType {
+	result := &AiSettingsType{}
+
+	for _, s := range settings {
+		if s == nil {
+			continue
+		}
+
+		// If this setting has AiClear=true, replace result with this entire setting
+		if s.AiClear {
+			result = s
+			result.AiClear = false
+			continue
+		}
+
+		// Merge non-empty values
+		if s.AiPreset != "" {
+			result.AiPreset = s.AiPreset
+		}
+		if s.AiApiType != "" {
+			result.AiApiType = s.AiApiType
+		}
+		if s.AiBaseURL != "" {
+			result.AiBaseURL = s.AiBaseURL
+		}
+		if s.AiApiToken != "" {
+			result.AiApiToken = s.AiApiToken
+		}
+		if s.AiName != "" {
+			result.AiName = s.AiName
+		}
+		if s.AiModel != "" {
+			result.AiModel = s.AiModel
+		}
+		if s.AiOrgID != "" {
+			result.AiOrgID = s.AiOrgID
+		}
+		if s.AIApiVersion != "" {
+			result.AIApiVersion = s.AIApiVersion
+		}
+		if s.AiProxyUrl != "" {
+			result.AiProxyUrl = s.AiProxyUrl
+		}
+		if s.AiMaxTokens != 0 {
+			result.AiMaxTokens = s.AiMaxTokens
+		}
+		if s.AiTimeoutMs != 0 {
+			result.AiTimeoutMs = s.AiTimeoutMs
+		}
+		if s.AiFontSize != 0 {
+			result.AiFontSize = s.AiFontSize
+		}
+		if s.AiFixedFontSize != 0 {
+			result.AiFixedFontSize = s.AiFixedFontSize
+		}
+		if s.DisplayName != "" {
+			result.DisplayName = s.DisplayName
+		}
+		if s.DisplayOrder != 0 {
+			result.DisplayOrder = s.DisplayOrder
+		}
+	}
+
+	return result
+}
+
 type ConfigError struct {
 	File string `json:"file"`
 	Err  string `json:"err"`

From 48370df20dd7cc2ccc6139447299838b51e0f6c8 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 12:51:19 -0700
Subject: [PATCH 18/29] move ai msg to ssehandler

---
 pkg/waveai/ssehandlerch.go | 114 +++++++++++++++++++++++++++----------
 pkg/waveai/usechat.go      |  56 +++---------------
 2 files changed, 91 insertions(+), 79 deletions(-)

diff --git a/pkg/waveai/ssehandlerch.go b/pkg/waveai/ssehandlerch.go
index f8b34792ae..87083a347a 100644
--- a/pkg/waveai/ssehandlerch.go
+++ b/pkg/waveai/ssehandlerch.go
@@ -12,13 +12,15 @@ import (
 	"time"
 )
 
+// see /aiprompts/usechat-streamingproto.md for protocol
+
 const (
-	SSEContentType        = "text/event-stream"
-	SSECacheControl       = "no-cache"
-	SSEConnection         = "keep-alive"
-	SSEKeepaliveMsg       = ": keepalive\n\n"
-	SSEStreamStartMsg     = ": stream-start\n\n"
-	SSEKeepaliveInterval  = 1 * time.Second
+	SSEContentType       = "text/event-stream"
+	SSECacheControl      = "no-cache"
+	SSEConnection        = "keep-alive"
+	SSEKeepaliveMsg      = ": keepalive\n\n"
+	SSEStreamStartMsg    = ": stream-start\n\n"
+	SSEKeepaliveInterval = 1 * time.Second
 )
 
 // SSEMessageType represents the type of message to write
@@ -31,6 +33,16 @@ const (
 	SSEMsgError   SSEMessageType = "error"
 )
 
+// AI message type constants
+const (
+	AiMsgStart     = "start"
+	AiMsgTextStart = "text-start"
+	AiMsgTextDelta = "text-delta"
+	AiMsgTextEnd   = "text-end"
+	AiMsgFinish    = "finish"
+	AiMsgError     = "error"
+)
+
 // SSEMessage represents a message to be written to the SSE stream
 type SSEMessage struct {
 	Type      SSEMessageType
@@ -45,11 +57,11 @@ type SSEHandlerCh struct {
 	ctx     context.Context
 	writeCh chan SSEMessage
 	errCh   chan error
-	
+
 	mu     sync.RWMutex
 	closed bool
 	err    error
-	
+
 	wg sync.WaitGroup
 }
 
@@ -68,16 +80,16 @@ func MakeSSEHandlerCh(w http.ResponseWriter, ctx context.Context) *SSEHandlerCh
 func (h *SSEHandlerCh) SetupSSE() error {
 	h.mu.Lock()
 	defer h.mu.Unlock()
-	
+
 	if h.closed {
 		return fmt.Errorf("SSE handler is closed")
 	}
-	
+
 	// Reset write deadline for streaming
 	if err := h.rc.SetWriteDeadline(time.Time{}); err != nil {
 		return fmt.Errorf("failed to reset write deadline: %v", err)
 	}
-	
+
 	// Set SSE headers
 	h.w.Header().Set("Content-Type", SSEContentType)
 	h.w.Header().Set("Cache-Control", "no-cache, no-store, must-revalidate")
@@ -85,28 +97,28 @@ func (h *SSEHandlerCh) SetupSSE() error {
 	h.w.Header().Set("x-vercel-ai-ui-message-stream", "v1")
 	h.w.Header().Set("X-Accel-Buffering", "no")
 	h.w.Header().Set("Cache-Control", "no-transform")
-	
+
 	// Send headers and establish streaming
 	h.w.WriteHeader(http.StatusOK)
 	fmt.Fprint(h.w, SSEStreamStartMsg)
 	if err := h.flush(); err != nil {
 		return err
 	}
-	
+
 	// Start the writer goroutine
 	h.wg.Add(1)
 	go h.writerLoop()
-	
+
 	return nil
 }
 
 // writerLoop handles all writes and keepalives in a single goroutine
 func (h *SSEHandlerCh) writerLoop() {
 	defer h.wg.Done()
-	
+
 	keepaliveTicker := time.NewTicker(SSEKeepaliveInterval)
 	defer keepaliveTicker.Stop()
-	
+
 	for {
 		select {
 		case msg, ok := <-h.writeCh:
@@ -115,18 +127,18 @@ func (h *SSEHandlerCh) writerLoop() {
 				h.writeDirectly("[DONE]", SSEMsgData)
 				return
 			}
-			
+
 			if err := h.writeMessage(msg); err != nil {
 				h.setError(err)
 				return
 			}
-			
+
 		case <-keepaliveTicker.C:
 			if err := h.writeDirectly("keepalive", SSEMsgComment); err != nil {
 				h.setError(err)
 				return
 			}
-			
+
 		case <-h.ctx.Done():
 			return
 		}
@@ -190,7 +202,7 @@ func (h *SSEHandlerCh) flush() error {
 func (h *SSEHandlerCh) setError(err error) {
 	h.mu.Lock()
 	defer h.mu.Unlock()
-	
+
 	if h.err == nil {
 		h.err = err
 		// Send error to error channel if there's space
@@ -206,11 +218,11 @@ func (h *SSEHandlerCh) WriteData(data string) error {
 	h.mu.RLock()
 	closed := h.closed
 	h.mu.RUnlock()
-	
+
 	if closed {
 		return fmt.Errorf("SSE handler is closed")
 	}
-	
+
 	select {
 	case h.writeCh <- SSEMessage{Type: SSEMsgData, Data: data}:
 		return nil
@@ -233,7 +245,7 @@ func (h *SSEHandlerCh) WriteJsonData(data interface{}) error {
 // WriteError queues an error message and closes the handler
 func (h *SSEHandlerCh) WriteError(errorMsg string) error {
 	errorResp := map[string]interface{}{
-		"type":      "error",
+		"type":      AiMsgError,
 		"errorText": errorMsg,
 	}
 	if err := h.WriteJsonData(errorResp); err != nil {
@@ -248,11 +260,11 @@ func (h *SSEHandlerCh) WriteEvent(eventType, data string) error {
 	h.mu.RLock()
 	closed := h.closed
 	h.mu.RUnlock()
-	
+
 	if closed {
 		return fmt.Errorf("SSE handler is closed")
 	}
-	
+
 	select {
 	case h.writeCh <- SSEMessage{Type: SSEMsgEvent, Data: data, EventType: eventType}:
 		return nil
@@ -268,11 +280,11 @@ func (h *SSEHandlerCh) WriteComment(comment string) error {
 	h.mu.RLock()
 	closed := h.closed
 	h.mu.RUnlock()
-	
+
 	if closed {
 		return fmt.Errorf("SSE handler is closed")
 	}
-	
+
 	select {
 	case h.writeCh <- SSEMessage{Type: SSEMsgComment, Data: comment}:
 		return nil
@@ -298,11 +310,53 @@ func (h *SSEHandlerCh) Close() {
 		return
 	}
 	h.closed = true
-	
+
 	// Close the write channel, which will trigger [DONE] in writerLoop
 	close(h.writeCh)
 	h.mu.Unlock()
-	
+
 	// Wait for writer goroutine to finish (without holding the lock)
 	h.wg.Wait()
-}
\ No newline at end of file
+}
+
+// AI message writing methods
+
+func (h *SSEHandlerCh) AiMsgStart(messageId string) error {
+	resp := map[string]interface{}{
+		"type":      AiMsgStart,
+		"messageId": messageId,
+	}
+	return h.WriteJsonData(resp)
+}
+
+func (h *SSEHandlerCh) AiMsgTextStart(textId string) error {
+	resp := map[string]interface{}{
+		"type": AiMsgTextStart,
+		"id":   textId,
+	}
+	return h.WriteJsonData(resp)
+}
+
+func (h *SSEHandlerCh) AiMsgTextDelta(textId string, text string) error {
+	resp := map[string]interface{}{
+		"type":  AiMsgTextDelta,
+		"id":    textId,
+		"delta": text,
+	}
+	return h.WriteJsonData(resp)
+}
+
+func (h *SSEHandlerCh) AiMsgTextEnd(textId string) error {
+	resp := map[string]interface{}{
+		"type": AiMsgTextEnd,
+		"id":   textId,
+	}
+	return h.WriteJsonData(resp)
+}
+
+func (h *SSEHandlerCh) AiMsgFinish(finishReason string, usage interface{}) error {
+	resp := map[string]interface{}{
+		"type": AiMsgFinish,
+	}
+	return h.WriteJsonData(resp)
+}
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index ee977141dc..ffc7249aeb 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -21,8 +21,6 @@ import (
 	"github.com/wavetermdev/waveterm/pkg/wstore"
 )
 
-// see /aiprompts/usechat-streamingproto.md for protocol
-
 type UseChatMessagePart struct {
 	Type string `json:"type"`
 	Text string `json:"text"`
@@ -229,7 +227,7 @@ func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *
 	textId := generateID()
 
 	// Send message start
-	writeMessageStart(sseHandler, messageId)
+	sseHandler.AiMsgStart(messageId)
 
 	// Track whether we've started text streaming and finished
 	textStarted := false
@@ -242,11 +240,11 @@ func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *
 		if err == io.EOF {
 			// Send text end and finish if text was started but not ended, and we haven't finished yet
 			if textStarted && !textEnded {
-				writeTextEnd(sseHandler, textId)
+				sseHandler.AiMsgTextEnd(textId)
 				textEnded = true
 			}
 			if !finished {
-				writeOpenAIFinish(sseHandler, "stop", nil)
+				sseHandler.AiMsgFinish("stop", nil)
 			}
 			return
 		}
@@ -260,10 +258,10 @@ func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *
 			if choice.Delta.Content != "" {
 				// Send text start only when we have actual content
 				if !textStarted {
-					writeTextStart(sseHandler, textId)
+					sseHandler.AiMsgTextStart(textId)
 					textStarted = true
 				}
-				writeUseChatTextDelta(sseHandler, textId, choice.Delta.Content)
+				sseHandler.AiMsgTextDelta(textId, choice.Delta.Content)
 			}
 			if choice.FinishReason != "" && !finished {
 				usage := &OpenAIUsageResponse{}
@@ -273,56 +271,16 @@ func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *
 					usage.TotalTokens = response.Usage.TotalTokens
 				}
 				if textStarted && !textEnded {
-					writeTextEnd(sseHandler, textId)
+					sseHandler.AiMsgTextEnd(textId)
 					textEnded = true
 				}
-				writeOpenAIFinish(sseHandler, string(choice.FinishReason), usage)
+				sseHandler.AiMsgFinish(string(choice.FinishReason), usage)
 				finished = true
 			}
 		}
 	}
 }
 
-func writeMessageStart(sseHandler *SSEHandlerCh, messageId string) {
-	resp := map[string]interface{}{
-		"type":      "start",
-		"messageId": messageId,
-	}
-	sseHandler.WriteJsonData(resp)
-}
-
-func writeTextStart(sseHandler *SSEHandlerCh, textId string) {
-	resp := map[string]interface{}{
-		"type": "text-start",
-		"id":   textId,
-	}
-	sseHandler.WriteJsonData(resp)
-}
-
-func writeUseChatTextDelta(sseHandler *SSEHandlerCh, textId string, text string) {
-	resp := map[string]interface{}{
-		"type":  "text-delta",
-		"id":    textId,
-		"delta": text,
-	}
-	sseHandler.WriteJsonData(resp)
-}
-
-func writeTextEnd(sseHandler *SSEHandlerCh, textId string) {
-	resp := map[string]interface{}{
-		"type": "text-end",
-		"id":   textId,
-	}
-	sseHandler.WriteJsonData(resp)
-}
-
-func writeOpenAIFinish(sseHandler *SSEHandlerCh, finishReason string, usage *OpenAIUsageResponse) {
-	resp := map[string]interface{}{
-		"type": "finish",
-	}
-	sseHandler.WriteJsonData(resp)
-}
-
 func generateID() string {
 	bytes := make([]byte, 16)
 	rand.Read(bytes)

From 7b084600ee16beec5d64794088579e740654b8db Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 13:00:30 -0700
Subject: [PATCH 19/29] add reasoning support

---
 pkg/waveai/ssehandlerch.go | 40 ++++++++++++++++++++++++++++++++------
 pkg/waveai/usechat.go      | 33 ++++++++++++++++++++++++++++---
 2 files changed, 64 insertions(+), 9 deletions(-)

diff --git a/pkg/waveai/ssehandlerch.go b/pkg/waveai/ssehandlerch.go
index 87083a347a..5302e2ffb9 100644
--- a/pkg/waveai/ssehandlerch.go
+++ b/pkg/waveai/ssehandlerch.go
@@ -35,12 +35,15 @@ const (
 
 // AI message type constants
 const (
-	AiMsgStart     = "start"
-	AiMsgTextStart = "text-start"
-	AiMsgTextDelta = "text-delta"
-	AiMsgTextEnd   = "text-end"
-	AiMsgFinish    = "finish"
-	AiMsgError     = "error"
+	AiMsgStart          = "start"
+	AiMsgTextStart      = "text-start"
+	AiMsgTextDelta      = "text-delta"
+	AiMsgTextEnd        = "text-end"
+	AiMsgReasoningStart = "reasoning-start"
+	AiMsgReasoningDelta = "reasoning-delta"
+	AiMsgReasoningEnd   = "reasoning-end"
+	AiMsgFinish         = "finish"
+	AiMsgError          = "error"
 )
 
 // SSEMessage represents a message to be written to the SSE stream
@@ -360,3 +363,28 @@ func (h *SSEHandlerCh) AiMsgFinish(finishReason string, usage interface{}) error
 	}
 	return h.WriteJsonData(resp)
 }
+
+func (h *SSEHandlerCh) AiMsgReasoningStart(reasoningId string) error {
+	resp := map[string]interface{}{
+		"type": AiMsgReasoningStart,
+		"id":   reasoningId,
+	}
+	return h.WriteJsonData(resp)
+}
+
+func (h *SSEHandlerCh) AiMsgReasoningDelta(reasoningId string, reasoning string) error {
+	resp := map[string]interface{}{
+		"type":  AiMsgReasoningDelta,
+		"id":    reasoningId,
+		"delta": reasoning,
+	}
+	return h.WriteJsonData(resp)
+}
+
+func (h *SSEHandlerCh) AiMsgReasoningEnd(reasoningId string) error {
+	resp := map[string]interface{}{
+		"type": AiMsgReasoningEnd,
+		"id":   reasoningId,
+	}
+	return h.WriteJsonData(resp)
+}
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index ffc7249aeb..7ebec4f030 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -58,7 +58,8 @@ type UseChatRequest struct {
 type OpenAIStreamChoice struct {
 	Index int `json:"index"`
 	Delta struct {
-		Content string `json:"content,omitempty"`
+		Content   string `json:"content,omitempty"`
+		Reasoning string `json:"reasoning,omitempty"`
 	} `json:"delta"`
 	FinishReason *string `json:"finish_reason"`
 }
@@ -225,20 +226,28 @@ func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *
 	// Generate IDs for the streaming protocol - use shorter, simpler IDs
 	messageId := generateID()
 	textId := generateID()
+	reasoningId := generateID()
 
 	// Send message start
 	sseHandler.AiMsgStart(messageId)
 
-	// Track whether we've started text streaming and finished
+	// Track whether we've started text/reasoning streaming and finished
 	textStarted := false
 	textEnded := false
+	reasoningStarted := false
+	reasoningEnded := false
 	finished := false
 
 	// Stream responses
 	for {
 		response, err := stream.Recv()
 		if err == io.EOF {
-			// Send text end and finish if text was started but not ended, and we haven't finished yet
+			// Send reasoning end if reasoning was started but not ended
+			if reasoningStarted && !reasoningEnded {
+				sseHandler.AiMsgReasoningEnd(reasoningId)
+				reasoningEnded = true
+			}
+			// Send text end if text was started but not ended
 			if textStarted && !textEnded {
 				sseHandler.AiMsgTextEnd(textId)
 				textEnded = true
@@ -255,6 +264,17 @@ func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *
 
 		// Process choices
 		for _, choice := range response.Choices {
+			// Handle reasoning tokens
+			if choice.Delta.ReasoningContent != "" {
+				// Send reasoning start only when we have actual reasoning content
+				if !reasoningStarted {
+					sseHandler.AiMsgReasoningStart(reasoningId)
+					reasoningStarted = true
+				}
+				sseHandler.AiMsgReasoningDelta(reasoningId, choice.Delta.ReasoningContent)
+			}
+
+			// Handle regular content tokens
 			if choice.Delta.Content != "" {
 				// Send text start only when we have actual content
 				if !textStarted {
@@ -263,6 +283,7 @@ func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *
 				}
 				sseHandler.AiMsgTextDelta(textId, choice.Delta.Content)
 			}
+
 			if choice.FinishReason != "" && !finished {
 				usage := &OpenAIUsageResponse{}
 				if response.Usage != nil && response.Usage.PromptTokens > 0 {
@@ -270,6 +291,12 @@ func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *
 					usage.CompletionTokens = response.Usage.CompletionTokens
 					usage.TotalTokens = response.Usage.TotalTokens
 				}
+				// End reasoning if it was started but not ended
+				if reasoningStarted && !reasoningEnded {
+					sseHandler.AiMsgReasoningEnd(reasoningId)
+					reasoningEnded = true
+				}
+				// End text if it was started but not ended
 				if textStarted && !textEnded {
 					sseHandler.AiMsgTextEnd(textId)
 					textEnded = true

From 6501329481feb7921c6f114f54da2691d371869f Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 13:40:38 -0700
Subject: [PATCH 20/29] responses and completions api

---
 go.mod                                   |   5 +
 go.sum                                   |  12 ++
 pkg/waveai/usechat-openai-completions.go | 158 ++++++++++++++++++++
 pkg/waveai/usechat-openai-responses.go   | 174 ++++++++++++++++++++++
 pkg/waveai/usechat.go                    | 177 ++---------------------
 5 files changed, 365 insertions(+), 161 deletions(-)
 create mode 100644 pkg/waveai/usechat-openai-completions.go
 create mode 100644 pkg/waveai/usechat-openai-responses.go

diff --git a/go.mod b/go.mod
index 171fb0ef9b..4bd6c29dab 100644
--- a/go.mod
+++ b/go.mod
@@ -23,6 +23,7 @@ require (
 	github.com/kevinburke/ssh_config v1.2.0
 	github.com/mattn/go-sqlite3 v1.14.32
 	github.com/mitchellh/mapstructure v1.5.0
+	github.com/openai/openai-go/v2 v2.1.1
 	github.com/sashabaranov/go-openai v1.41.1
 	github.com/sawka/txwrap v0.2.0
 	github.com/shirou/gopsutil/v4 v4.25.7
@@ -81,6 +82,10 @@ require (
 	github.com/rivo/uniseg v0.4.7 // indirect
 	github.com/sirupsen/logrus v1.9.3 // indirect
 	github.com/spf13/pflag v1.0.6 // indirect
+	github.com/tidwall/gjson v1.14.4 // indirect
+	github.com/tidwall/match v1.1.1 // indirect
+	github.com/tidwall/pretty v1.2.1 // indirect
+	github.com/tidwall/sjson v1.2.5 // indirect
 	github.com/tklauser/go-sysconf v0.3.15 // indirect
 	github.com/tklauser/numcpus v0.10.0 // indirect
 	github.com/ubuntu/decorate v0.0.0-20230125165522-2d5b0a9bb117 // indirect
diff --git a/go.sum b/go.sum
index 2c110b35aa..04952bbeff 100644
--- a/go.sum
+++ b/go.sum
@@ -131,6 +131,8 @@ github.com/mattn/go-sqlite3 v1.14.32 h1:JD12Ag3oLy1zQA+BNn74xRgaBbdhbNIDYvQUEuuE
 github.com/mattn/go-sqlite3 v1.14.32/go.mod h1:Uh1q+B4BYcTPb+yiD3kU8Ct7aC0hY9fxUwlHK0RXw+Y=
 github.com/mitchellh/mapstructure v1.5.0 h1:jeMsZIYE/09sWLaz43PL7Gy6RuMjD2eJVyuac5Z2hdY=
 github.com/mitchellh/mapstructure v1.5.0/go.mod h1:bFUtVrKA4DC2yAKiSyO/QUcy7e+RRV2QTWOzhPopBRo=
+github.com/openai/openai-go/v2 v2.1.1 h1:/RMA/V3D+yF/Cc4jHXFt6lkqSOWRf5roRi+DvZaDYQI=
+github.com/openai/openai-go/v2 v2.1.1/go.mod h1:sIUkR+Cu/PMUVkSKhkk742PRURkQOCFhiwJ7eRSBqmk=
 github.com/photostorm/pty v1.1.19-0.20230903182454-31354506054b h1:cLGKfKb1uk0hxI0Q8L83UAJPpeJ+gSpn3cCU/tjd3eg=
 github.com/photostorm/pty v1.1.19-0.20230903182454-31354506054b/go.mod h1:KO+FcPtyLAiRC0hJwreJVvfwc7vnNz77UxBTIGHdPVk=
 github.com/pmezard/go-difflib v1.0.0 h1:4DBwDE0NGyQoBHbLQYPwSUPoCMWR5BEzIk/f1lZbAQM=
@@ -164,6 +166,16 @@ github.com/stretchr/testify v1.4.0/go.mod h1:j7eGeouHqKxXV5pUuKE4zz7dFj8WfuZ+81P
 github.com/stretchr/testify v1.7.0/go.mod h1:6Fq8oRcR53rry900zMqJjRRixrwX3KX962/h/Wwjteg=
 github.com/stretchr/testify v1.10.0 h1:Xv5erBjTwe/5IxqUQTdXv5kgmIvbHo3QQyRwhJsOfJA=
 github.com/stretchr/testify v1.10.0/go.mod h1:r2ic/lqez/lEtzL7wO/rwa5dbSLXVDPFyf8C91i36aY=
+github.com/tidwall/gjson v1.14.2/go.mod h1:/wbyibRr2FHMks5tjHJ5F8dMZh3AcwJEMf5vlfC0lxk=
+github.com/tidwall/gjson v1.14.4 h1:uo0p8EbA09J7RQaflQ1aBRffTR7xedD2bcIVSYxLnkM=
+github.com/tidwall/gjson v1.14.4/go.mod h1:/wbyibRr2FHMks5tjHJ5F8dMZh3AcwJEMf5vlfC0lxk=
+github.com/tidwall/match v1.1.1 h1:+Ho715JplO36QYgwN9PGYNhgZvoUSc9X2c80KVTi+GA=
+github.com/tidwall/match v1.1.1/go.mod h1:eRSPERbgtNPcGhD8UCthc6PmLEQXEWd3PRB5JTxsfmM=
+github.com/tidwall/pretty v1.2.0/go.mod h1:ITEVvHYasfjBbM0u2Pg8T2nJnzm8xPwvNhhsoaGGjNU=
+github.com/tidwall/pretty v1.2.1 h1:qjsOFOWWQl+N3RsoF5/ssm1pHmJJwhjlSbZ51I6wMl4=
+github.com/tidwall/pretty v1.2.1/go.mod h1:ITEVvHYasfjBbM0u2Pg8T2nJnzm8xPwvNhhsoaGGjNU=
+github.com/tidwall/sjson v1.2.5 h1:kLy8mja+1c9jlljvWTlSazM7cKDRfJuR/bOJhcY5NcY=
+github.com/tidwall/sjson v1.2.5/go.mod h1:Fvgq9kS/6ociJEDnK0Fk1cpYF4FIW6ZF7LAe+6jwd28=
 github.com/tklauser/go-sysconf v0.3.15 h1:VE89k0criAymJ/Os65CSn1IXaol+1wrsFHEB8Ol49K4=
 github.com/tklauser/go-sysconf v0.3.15/go.mod h1:Dmjwr6tYFIseJw7a3dRLJfsHAMXZ3nEnL/aZY+0IuI4=
 github.com/tklauser/numcpus v0.10.0 h1:18njr6LDBk1zuna922MgdjQuJFjrdppsZG60sHGfjso=
diff --git a/pkg/waveai/usechat-openai-completions.go b/pkg/waveai/usechat-openai-completions.go
new file mode 100644
index 0000000000..ab6dada704
--- /dev/null
+++ b/pkg/waveai/usechat-openai-completions.go
@@ -0,0 +1,158 @@
+// Copyright 2025, Command Line Inc.
+// SPDX-License-Identifier: Apache-2.0
+
+package waveai
+
+import (
+	"context"
+	"fmt"
+	"strings"
+
+	"github.com/openai/openai-go/v2"
+	"github.com/openai/openai-go/v2/option"
+	"github.com/wavetermdev/waveterm/pkg/wshrpc"
+)
+
+// OpenAI Chat Completion streaming response format
+type OpenAIStreamChoice struct {
+	Index int `json:"index"`
+	Delta struct {
+		Content   string `json:"content,omitempty"`
+		Reasoning string `json:"reasoning,omitempty"`
+	} `json:"delta"`
+	FinishReason *string `json:"finish_reason"`
+}
+
+type OpenAIStreamResponse struct {
+	ID      string               `json:"id"`
+	Object  string               `json:"object"`
+	Created int64                `json:"created"`
+	Model   string               `json:"model"`
+	Choices []OpenAIStreamChoice `json:"choices"`
+	Usage   *OpenAIUsageResponse `json:"usage,omitempty"`
+}
+
+type OpenAIUsageResponse struct {
+	PromptTokens     int `json:"prompt_tokens"`
+	CompletionTokens int `json:"completion_tokens"`
+	TotalTokens      int `json:"total_tokens"`
+}
+
+func streamOpenAIChatCompletions(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+	// Set up OpenAI client options
+	clientOpts := []option.RequestOption{
+		option.WithAPIKey(opts.APIToken),
+	}
+
+	if opts.BaseURL != "" {
+		clientOpts = append(clientOpts, option.WithBaseURL(opts.BaseURL))
+	}
+	if opts.OrgID != "" {
+		clientOpts = append(clientOpts, option.WithOrganization(opts.OrgID))
+	}
+
+	client := openai.NewClient(clientOpts...)
+
+	// Convert messages to ChatCompletionMessageParam, filtering out empty content
+	var chatMessages []openai.ChatCompletionMessageParamUnion
+	for _, msg := range messages {
+		content := msg.GetContent()
+		// Skip messages with empty content as OpenAI requires non-empty content
+		if strings.TrimSpace(content) == "" {
+			continue
+		}
+
+		// Create appropriate message based on role
+		switch msg.Role {
+		case "user":
+			chatMessages = append(chatMessages, openai.UserMessage(content))
+		case "assistant":
+			chatMessages = append(chatMessages, openai.AssistantMessage(content))
+		case "system":
+			chatMessages = append(chatMessages, openai.SystemMessage(content))
+		default:
+			chatMessages = append(chatMessages, openai.UserMessage(content))
+		}
+	}
+
+	// Create request using Chat Completions API
+	req := openai.ChatCompletionNewParams{
+		Model:    opts.Model,
+		Messages: chatMessages,
+	}
+
+	if opts.MaxTokens > 0 {
+		req.MaxTokens = openai.Int(int64(opts.MaxTokens))
+	}
+
+	// Create stream using Chat Completions API
+	stream := client.Chat.Completions.NewStreaming(ctx, req)
+	defer stream.Close()
+
+	// Generate IDs for the streaming protocol
+	messageId := generateID()
+	textId := generateID()
+
+	// Send message start
+	sseHandler.AiMsgStart(messageId)
+
+	// Track whether we've started text streaming and finished
+	textStarted := false
+	textEnded := false
+	finished := false
+
+	// Stream responses using event-based API
+	for stream.Next() {
+		chunk := stream.Current()
+
+		if len(chunk.Choices) > 0 {
+			choice := chunk.Choices[0]
+
+			// Handle content delta
+			if choice.Delta.Content != "" {
+				// Send text start only when we have actual content
+				if !textStarted {
+					sseHandler.AiMsgTextStart(textId)
+					textStarted = true
+				}
+				sseHandler.AiMsgTextDelta(textId, choice.Delta.Content)
+			}
+
+			// Handle finish reason
+			if choice.FinishReason != "" && !finished {
+				usage := &OpenAIUsageResponse{}
+				if chunk.Usage.PromptTokens > 0 || chunk.Usage.CompletionTokens > 0 {
+					usage.PromptTokens = int(chunk.Usage.PromptTokens)
+					usage.CompletionTokens = int(chunk.Usage.CompletionTokens)
+					usage.TotalTokens = int(chunk.Usage.TotalTokens)
+				}
+
+				// End text if it was started but not ended
+				if textStarted && !textEnded {
+					sseHandler.AiMsgTextEnd(textId)
+					textEnded = true
+				}
+
+				sseHandler.AiMsgFinish(choice.FinishReason, usage)
+				finished = true
+				return
+			}
+		}
+	}
+
+	// Handle stream errors
+	if err := stream.Err(); err != nil {
+		sseHandler.WriteError(fmt.Sprintf("OpenAI API error: %v", err))
+		return
+	}
+
+	// Cleanup if stream ended without completion event
+	if !finished {
+		// End text if it was started but not ended
+		if textStarted && !textEnded {
+			sseHandler.AiMsgTextEnd(textId)
+			textEnded = true
+		}
+		sseHandler.AiMsgFinish("stop", nil)
+	}
+}
diff --git a/pkg/waveai/usechat-openai-responses.go b/pkg/waveai/usechat-openai-responses.go
new file mode 100644
index 0000000000..709c191c83
--- /dev/null
+++ b/pkg/waveai/usechat-openai-responses.go
@@ -0,0 +1,174 @@
+// Copyright 2025, Command Line Inc.
+// SPDX-License-Identifier: Apache-2.0
+
+package waveai
+
+import (
+	"context"
+	"fmt"
+	"strings"
+
+	"github.com/openai/openai-go/v2"
+	"github.com/openai/openai-go/v2/option"
+	"github.com/openai/openai-go/v2/responses"
+	"github.com/wavetermdev/waveterm/pkg/wshrpc"
+)
+
+func streamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+	// Set up OpenAI client options
+	clientOpts := []option.RequestOption{
+		option.WithAPIKey(opts.APIToken),
+	}
+
+	if opts.BaseURL != "" {
+		clientOpts = append(clientOpts, option.WithBaseURL(opts.BaseURL))
+	}
+	if opts.OrgID != "" {
+		clientOpts = append(clientOpts, option.WithOrganization(opts.OrgID))
+	}
+
+	client := openai.NewClient(clientOpts...)
+
+	// Convert messages to input items, filtering out empty content
+	var inputItems []responses.ResponseInputItemUnionParam
+	for _, msg := range messages {
+		content := msg.GetContent()
+		// Skip messages with empty content as OpenAI requires non-empty content
+		if strings.TrimSpace(content) == "" {
+			continue
+		}
+
+		// Convert role to EasyInputMessageRole
+		var role responses.EasyInputMessageRole
+		switch msg.Role {
+		case "user":
+			role = responses.EasyInputMessageRoleUser
+		case "assistant":
+			role = responses.EasyInputMessageRoleAssistant
+		case "system":
+			role = responses.EasyInputMessageRoleSystem
+		default:
+			role = responses.EasyInputMessageRoleUser
+		}
+
+		inputItems = append(inputItems, responses.ResponseInputItemParamOfMessage(content, role))
+	}
+
+	// Create request using Responses API for reasoning support
+	req := responses.ResponseNewParams{
+		Model: opts.Model,
+		Input: responses.ResponseNewParamsInputUnion{
+			OfInputItemList: responses.ResponseInputParam(inputItems),
+		},
+	}
+
+	if opts.MaxTokens > 0 {
+		req.MaxOutputTokens = openai.Int(int64(opts.MaxTokens))
+	}
+
+	// Create stream using Responses API
+	stream := client.Responses.NewStreaming(ctx, req)
+	defer stream.Close()
+
+	// Generate IDs for the streaming protocol
+	messageId := generateID()
+	textId := generateID()
+	reasoningId := generateID()
+
+	// Send message start
+	sseHandler.AiMsgStart(messageId)
+
+	// Track whether we've started text/reasoning streaming and finished
+	textStarted := false
+	textEnded := false
+	reasoningStarted := false
+	reasoningEnded := false
+	finished := false
+
+	// Stream responses using event-based API
+	for stream.Next() {
+		event := stream.Current()
+
+		switch event.Type {
+		case "response.output_text.delta":
+			textDelta := event.AsResponseOutputTextDelta()
+			if textDelta.Delta != "" {
+				// Send text start only when we have actual content
+				if !textStarted {
+					sseHandler.AiMsgTextStart(textId)
+					textStarted = true
+				}
+				sseHandler.AiMsgTextDelta(textId, textDelta.Delta)
+			}
+
+		case "response.reasoning_text.delta":
+			reasoningDelta := event.AsResponseReasoningTextDelta()
+			if reasoningDelta.Delta != "" {
+				// Send reasoning start only when we have actual reasoning content
+				if !reasoningStarted {
+					sseHandler.AiMsgReasoningStart(reasoningId)
+					reasoningStarted = true
+				}
+				sseHandler.AiMsgReasoningDelta(reasoningId, reasoningDelta.Delta)
+			}
+
+		case "response.reasoning_text.done":
+			// End reasoning when reasoning text is done
+			if reasoningStarted && !reasoningEnded {
+				sseHandler.AiMsgReasoningEnd(reasoningId)
+				reasoningEnded = true
+			}
+
+		case "response.completed":
+			responseDone := event.AsResponseCompleted()
+			if !finished {
+				usage := &OpenAIUsageResponse{}
+				responseUsage := responseDone.Response.Usage
+				usage.PromptTokens = int(responseUsage.InputTokens)
+				usage.CompletionTokens = int(responseUsage.OutputTokens)
+				usage.TotalTokens = usage.PromptTokens + usage.CompletionTokens
+
+				// End reasoning if it was started but not ended
+				if reasoningStarted && !reasoningEnded {
+					sseHandler.AiMsgReasoningEnd(reasoningId)
+					reasoningEnded = true
+				}
+				// End text if it was started but not ended
+				if textStarted && !textEnded {
+					sseHandler.AiMsgTextEnd(textId)
+					textEnded = true
+				}
+
+				finishReason := "stop"
+				if responseDone.Response.Status == "completed" {
+					finishReason = "stop"
+				}
+
+				sseHandler.AiMsgFinish(finishReason, usage)
+				finished = true
+			}
+			return
+		}
+	}
+
+	// Handle stream errors
+	if err := stream.Err(); err != nil {
+		sseHandler.WriteError(fmt.Sprintf("OpenAI API error: %v", err))
+		return
+	}
+
+	// Cleanup if stream ended without completion event
+	if !finished {
+		// End reasoning if it was started but not ended
+		if reasoningStarted && !reasoningEnded {
+			sseHandler.AiMsgReasoningEnd(reasoningId)
+			reasoningEnded = true
+		}
+		// End text if it was started but not ended
+		if textStarted && !textEnded {
+			sseHandler.AiMsgTextEnd(textId)
+			textEnded = true
+		}
+		sseHandler.AiMsgFinish("stop", nil)
+	}
+}
\ No newline at end of file
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index 7ebec4f030..f0cffd04ca 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -9,12 +9,10 @@ import (
 	"encoding/hex"
 	"encoding/json"
 	"fmt"
-	"io"
 	"log"
 	"net/http"
 	"strings"
 
-	openaiapi "github.com/sashabaranov/go-openai"
 	"github.com/wavetermdev/waveterm/pkg/waveobj"
 	"github.com/wavetermdev/waveterm/pkg/wconfig"
 	"github.com/wavetermdev/waveterm/pkg/wshrpc"
@@ -54,31 +52,6 @@ type UseChatRequest struct {
 	Options  *wconfig.AiSettingsType `json:"options,omitempty"`
 }
 
-// OpenAI Chat Completion streaming response format
-type OpenAIStreamChoice struct {
-	Index int `json:"index"`
-	Delta struct {
-		Content   string `json:"content,omitempty"`
-		Reasoning string `json:"reasoning,omitempty"`
-	} `json:"delta"`
-	FinishReason *string `json:"finish_reason"`
-}
-
-type OpenAIStreamResponse struct {
-	ID      string               `json:"id"`
-	Object  string               `json:"object"`
-	Created int64                `json:"created"`
-	Model   string               `json:"model"`
-	Choices []OpenAIStreamChoice `json:"choices"`
-	Usage   *OpenAIUsageResponse `json:"usage,omitempty"`
-}
-
-type OpenAIUsageResponse struct {
-	PromptTokens     int `json:"prompt_tokens"`
-	CompletionTokens int `json:"completion_tokens"`
-	TotalTokens      int `json:"total_tokens"`
-}
-
 func resolveAIConfig(ctx context.Context, blockId, presetKey string, requestOptions *wconfig.AiSettingsType) (*wshrpc.WaveAIOptsType, error) {
 	// Get block metadata
 	block, err := wstore.DBMustGet[*waveobj.Block](ctx, blockId)
@@ -170,141 +143,23 @@ func mustMarshal(v any) []byte {
 	return data
 }
 
-func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
-
-	// Set up OpenAI client
-	clientConfig := openaiapi.DefaultConfig(opts.APIToken)
-	if opts.BaseURL != "" {
-		clientConfig.BaseURL = opts.BaseURL
-	}
-	if opts.OrgID != "" {
-		clientConfig.OrgID = opts.OrgID
-	}
-	if opts.APIVersion != "" {
-		clientConfig.APIVersion = opts.APIVersion
-	}
-
-	client := openaiapi.NewClientWithConfig(clientConfig)
-
-	// Convert messages, filtering out empty content
-	var openaiMessages []openaiapi.ChatCompletionMessage
-	for _, msg := range messages {
-		content := msg.GetContent()
-		// Skip messages with empty content as OpenAI requires non-empty content
-		if strings.TrimSpace(content) == "" {
-			continue
-		}
-		openaiMessages = append(openaiMessages, openaiapi.ChatCompletionMessage{
-			Role:    msg.Role,
-			Content: content,
-		})
-	}
-
-	// Create request
-	req := openaiapi.ChatCompletionRequest{
-		Model:    opts.Model,
-		Messages: openaiMessages,
-		Stream:   true,
-	}
-
-	if opts.MaxTokens > 0 {
-		if isReasoningModel(opts.Model) {
-			req.MaxCompletionTokens = opts.MaxTokens
-		} else {
-			req.MaxTokens = opts.MaxTokens
-		}
-	}
-
-	// Create stream
-	stream, err := client.CreateChatCompletionStream(ctx, req)
-	if err != nil {
-		sseHandler.WriteError(fmt.Sprintf("OpenAI API error: %v", err))
-		return
-	}
-	defer stream.Close()
-
-	// Generate IDs for the streaming protocol - use shorter, simpler IDs
-	messageId := generateID()
-	textId := generateID()
-	reasoningId := generateID()
-
-	// Send message start
-	sseHandler.AiMsgStart(messageId)
-
-	// Track whether we've started text/reasoning streaming and finished
-	textStarted := false
-	textEnded := false
-	reasoningStarted := false
-	reasoningEnded := false
-	finished := false
-
-	// Stream responses
-	for {
-		response, err := stream.Recv()
-		if err == io.EOF {
-			// Send reasoning end if reasoning was started but not ended
-			if reasoningStarted && !reasoningEnded {
-				sseHandler.AiMsgReasoningEnd(reasoningId)
-				reasoningEnded = true
-			}
-			// Send text end if text was started but not ended
-			if textStarted && !textEnded {
-				sseHandler.AiMsgTextEnd(textId)
-				textEnded = true
-			}
-			if !finished {
-				sseHandler.AiMsgFinish("stop", nil)
-			}
-			return
-		}
-		if err != nil {
-			sseHandler.WriteError(fmt.Sprintf("Stream error: %v", err))
-			return
-		}
-
-		// Process choices
-		for _, choice := range response.Choices {
-			// Handle reasoning tokens
-			if choice.Delta.ReasoningContent != "" {
-				// Send reasoning start only when we have actual reasoning content
-				if !reasoningStarted {
-					sseHandler.AiMsgReasoningStart(reasoningId)
-					reasoningStarted = true
-				}
-				sseHandler.AiMsgReasoningDelta(reasoningId, choice.Delta.ReasoningContent)
-			}
-
-			// Handle regular content tokens
-			if choice.Delta.Content != "" {
-				// Send text start only when we have actual content
-				if !textStarted {
-					sseHandler.AiMsgTextStart(textId)
-					textStarted = true
-				}
-				sseHandler.AiMsgTextDelta(textId, choice.Delta.Content)
-			}
+func shouldUseChatCompletionsAPI(model string) bool {
+	m := strings.ToLower(model)
+	// Chat Completions API is required for older models: gpt-3.5-*, gpt-4, gpt-4-turbo, o1-*
+	return strings.HasPrefix(m, "gpt-3.5") ||
+		strings.HasPrefix(m, "gpt-4-") ||
+		m == "gpt-4" ||
+		strings.HasPrefix(m, "o1-")
+}
 
-			if choice.FinishReason != "" && !finished {
-				usage := &OpenAIUsageResponse{}
-				if response.Usage != nil && response.Usage.PromptTokens > 0 {
-					usage.PromptTokens = response.Usage.PromptTokens
-					usage.CompletionTokens = response.Usage.CompletionTokens
-					usage.TotalTokens = response.Usage.TotalTokens
-				}
-				// End reasoning if it was started but not ended
-				if reasoningStarted && !reasoningEnded {
-					sseHandler.AiMsgReasoningEnd(reasoningId)
-					reasoningEnded = true
-				}
-				// End text if it was started but not ended
-				if textStarted && !textEnded {
-					sseHandler.AiMsgTextEnd(textId)
-					textEnded = true
-				}
-				sseHandler.AiMsgFinish(string(choice.FinishReason), usage)
-				finished = true
-			}
-		}
+func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+	// Route to appropriate API based on model
+	if shouldUseChatCompletionsAPI(opts.Model) {
+		// Older models (gpt-3.5, gpt-4, gpt-4-turbo, o1-*) use Chat Completions API
+		streamOpenAIChatCompletions(sseHandler, ctx, opts, messages)
+	} else {
+		// Newer models (gpt-4.1, gpt-4o, gpt-5, o3, o4, etc.) use Responses API for reasoning support
+		streamOpenAIResponsesAPI(sseHandler, ctx, opts, messages)
 	}
 }
 

From dd35b3f0a0b328ae946cff7d7fae2b73bdd79b0b Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 14:57:18 -0700
Subject: [PATCH 21/29] fix lint error

---
 pkg/wavebase/wavebase.go | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pkg/wavebase/wavebase.go b/pkg/wavebase/wavebase.go
index 2d2c30064b..351426060c 100644
--- a/pkg/wavebase/wavebase.go
+++ b/pkg/wavebase/wavebase.go
@@ -289,7 +289,7 @@ func unameKernelRelease() string {
 	}
 	releaseStr := strings.TrimSpace(string(out))
 	m := releaseRegex.FindStringSubmatch(releaseStr)
-	if m == nil || len(m) < 2 {
+	if len(m) < 2 {
 		log.Printf("invalid uname -r output: [%s]\n", releaseStr)
 		return "-"
 	}

From 1f903f1be46be99da825c6def797c12cdd78274f Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 14:57:26 -0700
Subject: [PATCH 22/29] less noise from linter

---
 staticcheck.conf | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/staticcheck.conf b/staticcheck.conf
index 23487ed228..fb7fab3cd7 100644
--- a/staticcheck.conf
+++ b/staticcheck.conf
@@ -1,2 +1,2 @@
-checks = ["all", "-ST1005", "-QF1003", "-ST1000", "-ST1003", "-ST1020", "-ST1021"]
+checks = ["all", "-ST1005", "-QF1003", "-ST1000", "-ST1003", "-ST1020", "-ST1021", "-ST1022"]
 

From 7881024e0f7adfd8d0d094b069b7d11e8402fc87 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 15:16:50 -0700
Subject: [PATCH 23/29] working on reasoning

---
 cmd/testai/main-testai.go                  | 111 +++++++++++++++++++++
 frontend/app/view/waveai/waveaiusechat.tsx |  96 ++++++++++++------
 pkg/waveai/usechat-openai-completions.go   |   8 +-
 pkg/waveai/usechat-openai-responses.go     |  78 ++++++++++++---
 pkg/waveai/usechat.go                      |   8 +-
 5 files changed, 251 insertions(+), 50 deletions(-)
 create mode 100644 cmd/testai/main-testai.go

diff --git a/cmd/testai/main-testai.go b/cmd/testai/main-testai.go
new file mode 100644
index 0000000000..87b34d4bb0
--- /dev/null
+++ b/cmd/testai/main-testai.go
@@ -0,0 +1,111 @@
+// Copyright 2025, Command Line Inc.
+// SPDX-License-Identifier: Apache-2.0
+
+package main
+
+import (
+	"context"
+	"fmt"
+	"net/http"
+	"os"
+	"time"
+
+	"github.com/wavetermdev/waveterm/pkg/waveai"
+	"github.com/wavetermdev/waveterm/pkg/wshrpc"
+)
+
+// TestResponseWriter implements http.ResponseWriter and additional interfaces for testing
+type TestResponseWriter struct {
+	header http.Header
+}
+
+func (w *TestResponseWriter) Header() http.Header {
+	if w.header == nil {
+		w.header = make(http.Header)
+	}
+	return w.header
+}
+
+func (w *TestResponseWriter) Write(data []byte) (int, error) {
+	fmt.Printf("SSE: %s", string(data))
+	return len(data), nil
+}
+
+func (w *TestResponseWriter) WriteHeader(statusCode int) {
+	fmt.Printf("Status: %d\n", statusCode)
+}
+
+// Implement http.Flusher interface
+func (w *TestResponseWriter) Flush() {
+	// No-op for testing
+}
+
+// Implement interfaces needed by http.ResponseController
+func (w *TestResponseWriter) SetWriteDeadline(deadline time.Time) error {
+	// No-op for testing
+	return nil
+}
+
+func (w *TestResponseWriter) SetReadDeadline(deadline time.Time) error {
+	// No-op for testing
+	return nil
+}
+
+func main() {
+	if len(os.Args) < 2 {
+		fmt.Println("Usage: go run main-testai.go <model> [message]")
+		fmt.Println("Example: go run main-testai.go o4-mini 'What is 2+2?'")
+		fmt.Println("Set OPENAI_API_KEY environment variable")
+		os.Exit(1)
+	}
+
+	apiKey := os.Getenv("OPENAI_API_KEY")
+	if apiKey == "" {
+		fmt.Println("Error: OPENAI_API_KEY environment variable not set")
+		os.Exit(1)
+	}
+
+	model := os.Args[1]
+	message := "What is 2+2?"
+	if len(os.Args) > 2 {
+		message = os.Args[2]
+	}
+
+	// Create AI options
+	opts := &wshrpc.WaveAIOptsType{
+		APIToken:  apiKey,
+		Model:     model,
+		MaxTokens: 1000,
+	}
+
+	// Create messages
+	messages := []waveai.UseChatMessage{
+		{
+			Role:    "user",
+			Content: message,
+		},
+	}
+
+	fmt.Printf("Testing AI streaming with model: %s\n", model)
+	fmt.Printf("Message: %s\n", message)
+	fmt.Println("---")
+
+	// Create a test response writer and SSE handler
+	ctx := context.Background()
+	testWriter := &TestResponseWriter{}
+	sseHandler := waveai.MakeSSEHandlerCh(testWriter, ctx)
+
+	// Setup the SSE handler
+	err := sseHandler.SetupSSE()
+	if err != nil {
+		fmt.Printf("Error setting up SSE: %v\n", err)
+		return
+	}
+	defer sseHandler.Close()
+
+	// Call the streaming function
+	waveai.StreamOpenAIToUseChat(sseHandler, ctx, opts, messages)
+
+	fmt.Println("---")
+	fmt.Println("Test completed")
+}
diff --git a/frontend/app/view/waveai/waveaiusechat.tsx b/frontend/app/view/waveai/waveaiusechat.tsx
index 48cfc55b1d..3a3041639c 100644
--- a/frontend/app/view/waveai/waveaiusechat.tsx
+++ b/frontend/app/view/waveai/waveaiusechat.tsx
@@ -5,8 +5,8 @@ import { Button } from "@/app/element/button";
 import { Markdown } from "@/app/element/markdown";
 import { TypingIndicator } from "@/app/element/typingindicator";
 import { atoms, fetchWaveFile, WOS } from "@/store/global";
-import { getWebServerEndpoint } from "@/util/endpoints";
 import { BlockService, ObjectService } from "@/store/services";
+import { getWebServerEndpoint } from "@/util/endpoints";
 import { checkKeyPressed } from "@/util/keyutil";
 import { fireAndForget, isBlank, mergeMeta } from "@/util/util";
 import { useChat } from "@ai-sdk/react";
@@ -25,6 +25,7 @@ interface ChatMessage {
     id: string;
     role: "user" | "assistant" | "system";
     content: string;
+    reasoning?: string;
 }
 
 const slidingWindowSize = 30;
@@ -355,7 +356,7 @@ ChatWindow.displayName = "ChatWindow";
 
 const ChatItem = memo(
     ({ message, fontSize, fixedFontSize }: { message: ChatMessage; fontSize?: string; fixedFontSize?: string }) => {
-        const { role, content } = message;
+        const { role, content, reasoning } = message;
 
         if (role === "user") {
             return (
@@ -381,13 +382,29 @@ const ChatItem = memo(
                     <div className="flex-shrink-0 w-8 h-8 bg-accent/10 rounded-md flex items-center justify-center">
                         <i className="fa-sharp fa-solid fa-sparkles text-accent"></i>
                     </div>
-                    <div className="bg-secondary/10 rounded-lg p-3 max-w-[85%]">
-                        <Markdown
-                            text={content}
-                            scrollable={false}
-                            fontSizeOverride={fontSize ? parseInt(fontSize) : undefined}
-                            fixedFontSizeOverride={fixedFontSize ? parseInt(fixedFontSize) : undefined}
-                        />
+                    <div className="flex flex-col gap-2 max-w-[85%]">
+                        {reasoning && (
+                            <div className="bg-yellow-50 border border-yellow-200 rounded-lg p-3">
+                                <div className="flex items-center gap-2 mb-2">
+                                    <i className="fa-sharp fa-solid fa-brain text-yellow-600 text-sm"></i>
+                                    <span className="text-yellow-800 text-sm font-medium">Reasoning</span>
+                                </div>
+                                <Markdown
+                                    text={reasoning}
+                                    scrollable={false}
+                                    fontSizeOverride={fontSize ? parseInt(fontSize) : undefined}
+                                    fixedFontSizeOverride={fixedFontSize ? parseInt(fixedFontSize) : undefined}
+                                />
+                            </div>
+                        )}
+                        <div className="bg-secondary/10 rounded-lg p-3">
+                            <Markdown
+                                text={content}
+                                scrollable={false}
+                                fontSizeOverride={fontSize ? parseInt(fontSize) : undefined}
+                                fixedFontSizeOverride={fixedFontSize ? parseInt(fixedFontSize) : undefined}
+                            />
+                        </div>
                     </div>
                 </div>
             );
@@ -498,16 +515,16 @@ const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
     const [input, setInput] = useState("");
     const { messages, sendMessage, status, error, setMessages, stop } = useChat({
         id: `chat-${blockId}`,
-        messages: initialMessages.map(m => ({
+        messages: initialMessages.map((m) => ({
             id: m.id,
             role: m.role,
-            parts: [{ type: 'text', text: m.content }]
+            parts: [{ type: "text", text: m.content }],
         })),
         transport: new DefaultChatTransport({
             api: `${getWebServerEndpoint()}/api/aichat?blockid=${blockId}&preset=${encodeURIComponent(presetKey)}`,
             body: () => ({
                 blockId,
-                preset: presetKey
+                preset: presetKey,
             }),
             headers: async () => ({
                 "X-Block-ID": blockId,
@@ -526,11 +543,16 @@ const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
             // Save conversation after each completion
             try {
                 const allMessages = [...messages, message];
-                const chatMessages = allMessages.map(m => ({
-                    id: m.id,
-                    role: m.role as "user" | "assistant" | "system",
-                    content: m.parts.map(p => p.type === 'text' ? p.text : '').join('')
-                }));
+                const chatMessages = allMessages.map((m) => {
+                    const text = m.parts?.filter((p: any) => p.type === 'text').map((p: any) => p.text).join('') ?? '';
+                    const reasoning = m.parts?.filter((p: any) => p.type === 'reasoning').map((p: any) => p.text).join('') ?? '';
+                    return {
+                        id: m.id,
+                        role: m.role as "user" | "assistant" | "system",
+                        content: text,
+                        reasoning,
+                    };
+                });
                 await model.saveMessages(chatMessages);
             } catch (error) {
                 console.error("Failed to save messages:", error);
@@ -547,13 +569,16 @@ const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
         setInput(e.target.value);
     }, []);
 
-    const handleSubmit = useCallback((e: React.FormEvent) => {
-        e.preventDefault();
-        if (!input.trim() || isLoading) return;
-        
-        sendMessage({ text: input });
-        setInput("");
-    }, [input, isLoading, sendMessage]);
+    const handleSubmit = useCallback(
+        (e: React.FormEvent) => {
+            e.preventDefault();
+            if (!input.trim() || isLoading) return;
+
+            sendMessage({ text: input });
+            setInput("");
+        },
+        [input, isLoading, sendMessage]
+    );
 
     // Clear messages handler
     const handleClearMessages = useCallback(async () => {
@@ -581,11 +606,24 @@ const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
     return (
         <div className="flex flex-col h-full w-full bg-background">
             <ChatWindow
-                messages={messages.map(m => ({
-                    id: m.id,
-                    role: m.role as "user" | "assistant" | "system",
-                    content: m.parts.map(p => p.type === 'text' ? p.text : '').join('')
-                }))}
+                messages={messages.map((m) => {
+                    const text = m.parts
+                        .filter((p: any) => p.type === 'text')
+                        .map((p: any) => p.text)
+                        .join('');
+
+                    const reasoning = m.parts
+                        .filter((p: any) => p.type === 'reasoning')
+                        .map((p: any) => p.text)
+                        .join('');
+
+                    return {
+                        id: m.id,
+                        role: m.role as "user" | "assistant" | "system",
+                        content: text,
+                        reasoning,
+                    };
+                })}
                 isLoading={isLoading}
                 error={error}
                 fontSize={fontSize}
diff --git a/pkg/waveai/usechat-openai-completions.go b/pkg/waveai/usechat-openai-completions.go
index ab6dada704..31944d27db 100644
--- a/pkg/waveai/usechat-openai-completions.go
+++ b/pkg/waveai/usechat-openai-completions.go
@@ -38,7 +38,7 @@ type OpenAIUsageResponse struct {
 	TotalTokens      int `json:"total_tokens"`
 }
 
-func streamOpenAIChatCompletions(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+func StreamOpenAIChatCompletions(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
 	// Set up OpenAI client options
 	clientOpts := []option.RequestOption{
 		option.WithAPIKey(opts.APIToken),
@@ -82,7 +82,11 @@ func streamOpenAIChatCompletions(sseHandler *SSEHandlerCh, ctx context.Context,
 	}
 
 	if opts.MaxTokens > 0 {
-		req.MaxTokens = openai.Int(int64(opts.MaxTokens))
+		if isReasoningModel(opts.Model) {
+			req.MaxCompletionTokens = openai.Int(int64(opts.MaxTokens))
+		} else {
+			req.MaxTokens = openai.Int(int64(opts.MaxTokens))
+		}
 	}
 
 	// Create stream using Chat Completions API
diff --git a/pkg/waveai/usechat-openai-responses.go b/pkg/waveai/usechat-openai-responses.go
index 709c191c83..bb7d19706e 100644
--- a/pkg/waveai/usechat-openai-responses.go
+++ b/pkg/waveai/usechat-openai-responses.go
@@ -11,10 +11,12 @@ import (
 	"github.com/openai/openai-go/v2"
 	"github.com/openai/openai-go/v2/option"
 	"github.com/openai/openai-go/v2/responses"
+	"github.com/openai/openai-go/v2/shared"
+	"github.com/wavetermdev/waveterm/pkg/wavebase"
 	"github.com/wavetermdev/waveterm/pkg/wshrpc"
 )
 
-func streamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+func createOpenAIRequest(opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) (openai.Client, responses.ResponseNewParams) {
 	// Set up OpenAI client options
 	clientOpts := []option.RequestOption{
 		option.WithAPIKey(opts.APIToken),
@@ -62,10 +64,24 @@ func streamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 		},
 	}
 
+	// Only set reasoning parameter for reasoning models
+	if isReasoningModel(opts.Model) {
+		req.Reasoning = shared.ReasoningParam{
+			Effort:  openai.ReasoningEffortMedium,
+			Summary: openai.ReasoningSummaryAuto,
+		}
+	}
+
 	if opts.MaxTokens > 0 {
 		req.MaxOutputTokens = openai.Int(int64(opts.MaxTokens))
 	}
 
+	return client, req
+}
+
+func StreamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+	client, req := createOpenAIRequest(opts, messages)
+
 	// Create stream using Responses API
 	stream := client.Responses.NewStreaming(ctx, req)
 	defer stream.Close()
@@ -89,11 +105,44 @@ func streamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 	for stream.Next() {
 		event := stream.Current()
 
+		// fmt.Printf("DEBUG: Received event type: %s\n", event.Type)
+
 		switch event.Type {
+		case "response.output_item.added":
+			outputItem := event.AsResponseOutputItemAdded()
+			// fmt.Printf("DEBUG: output_item.added - Type: %s\n", outputItem.Item.Type)
+			if outputItem.Item.Type == "reasoning" && !reasoningStarted {
+				sseHandler.AiMsgReasoningStart(reasoningId)
+				reasoningStarted = true
+			}
+
+		case "response.reasoning_summary_part.added":
+			// Optional; first empty part—no-op
+
+		case "response.reasoning_summary_text.delta":
+			reasoningDelta := event.AsResponseReasoningSummaryTextDelta()
+			if reasoningDelta.Delta != "" {
+				sseHandler.AiMsgReasoningDelta(reasoningId, reasoningDelta.Delta)
+			}
+
+		case "response.reasoning_summary_text.done":
+			if reasoningStarted && !reasoningEnded {
+				sseHandler.AiMsgReasoningEnd(reasoningId)
+				reasoningEnded = true
+			}
+
+		case "response.reasoning_summary_part.done":
+			// Reasoning summary part done - no action needed
+
+		case "response.content_part.added":
+			// First output_text part for message—no-op
+
+		case "response.content_part.done":
+			// Content part done - no action needed
+
 		case "response.output_text.delta":
 			textDelta := event.AsResponseOutputTextDelta()
 			if textDelta.Delta != "" {
-				// Send text start only when we have actual content
 				if !textStarted {
 					sseHandler.AiMsgTextStart(textId)
 					textStarted = true
@@ -101,19 +150,12 @@ func streamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 				sseHandler.AiMsgTextDelta(textId, textDelta.Delta)
 			}
 
-		case "response.reasoning_text.delta":
-			reasoningDelta := event.AsResponseReasoningTextDelta()
-			if reasoningDelta.Delta != "" {
-				// Send reasoning start only when we have actual reasoning content
-				if !reasoningStarted {
-					sseHandler.AiMsgReasoningStart(reasoningId)
-					reasoningStarted = true
-				}
-				sseHandler.AiMsgReasoningDelta(reasoningId, reasoningDelta.Delta)
-			}
+		case "response.output_text.done":
+			// Finalize text if needed
 
-		case "response.reasoning_text.done":
-			// End reasoning when reasoning text is done
+		case "response.output_item.done":
+			// Item-level close (reasoning or message)
+			// If we had started reasoning but haven't ended it, end it now
 			if reasoningStarted && !reasoningEnded {
 				sseHandler.AiMsgReasoningEnd(reasoningId)
 				reasoningEnded = true
@@ -148,6 +190,12 @@ func streamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 				finished = true
 			}
 			return
+
+		default:
+			// Log unhandled event types in dev mode
+			if wavebase.IsDevMode() {
+				fmt.Printf("DEBUG: Unhandled event type: %s\n", event.Type)
+			}
 		}
 	}
 
@@ -171,4 +219,4 @@ func streamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 		}
 		sseHandler.AiMsgFinish("stop", nil)
 	}
-}
\ No newline at end of file
+}
diff --git a/pkg/waveai/usechat.go b/pkg/waveai/usechat.go
index f0cffd04ca..8cd4eec844 100644
--- a/pkg/waveai/usechat.go
+++ b/pkg/waveai/usechat.go
@@ -152,14 +152,14 @@ func shouldUseChatCompletionsAPI(model string) bool {
 		strings.HasPrefix(m, "o1-")
 }
 
-func streamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
+func StreamOpenAIToUseChat(sseHandler *SSEHandlerCh, ctx context.Context, opts *wshrpc.WaveAIOptsType, messages []UseChatMessage) {
 	// Route to appropriate API based on model
 	if shouldUseChatCompletionsAPI(opts.Model) {
 		// Older models (gpt-3.5, gpt-4, gpt-4-turbo, o1-*) use Chat Completions API
-		streamOpenAIChatCompletions(sseHandler, ctx, opts, messages)
+		StreamOpenAIChatCompletions(sseHandler, ctx, opts, messages)
 	} else {
 		// Newer models (gpt-4.1, gpt-4o, gpt-5, o3, o4, etc.) use Responses API for reasoning support
-		streamOpenAIResponsesAPI(sseHandler, ctx, opts, messages)
+		StreamOpenAIResponsesAPI(sseHandler, ctx, opts, messages)
 	}
 }
 
@@ -227,5 +227,5 @@ func HandleAIChat(w http.ResponseWriter, r *http.Request) {
 	}
 
 	// Stream OpenAI response
-	streamOpenAIToUseChat(sseHandler, r.Context(), aiOpts, req.Messages)
+	StreamOpenAIToUseChat(sseHandler, r.Context(), aiOpts, req.Messages)
 }

From 94872979a5fcf31fb678b7c72cbd848d63017143 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 15:38:39 -0700
Subject: [PATCH 24/29] add cn for comps to util

---
 frontend/util/util.ts | 8 +++++++-
 1 file changed, 7 insertions(+), 1 deletion(-)

diff --git a/frontend/util/util.ts b/frontend/util/util.ts
index 34391f979c..43a1e02408 100644
--- a/frontend/util/util.ts
+++ b/frontend/util/util.ts
@@ -2,9 +2,10 @@
 // SPDX-License-Identifier: Apache-2.0s
 
 import base64 from "base64-js";
-import clsx from "clsx";
+import clsx, { type ClassValue } from "clsx";
 import { Atom, atom, Getter, SetStateAction, Setter, useAtomValue } from "jotai";
 import { debounce, throttle } from "throttle-debounce";
+import { twMerge } from "tailwind-merge";
 const prevValueCache = new WeakMap<any, any>(); // stores a previous value for a deep equal comparison (used with the deepCompareReturnPrev function)
 
 function isBlank(str: string): boolean {
@@ -377,12 +378,17 @@ function mergeMeta(meta: MetaType, metaUpdate: MetaType, prefix?: string): MetaT
     return rtn;
 }
 
+function cn(...inputs: ClassValue[]) {
+    return twMerge(clsx(inputs));
+}
+
 export {
     atomWithDebounce,
     atomWithThrottle,
     base64ToArray,
     base64ToString,
     boundNumber,
+    cn,
     countGraphemes,
     deepCompareReturnPrev,
     fireAndForget,

From b55173440c67af248ca776940178edfbca1e44e0 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 15:50:20 -0700
Subject: [PATCH 25/29] streamdown, fix reasoning component

---
 frontend/app/view/waveai/waveaiusechat.tsx |  35 +-
 package.json                               |   1 +
 yarn.lock                                  | 366 ++++++++++++++++++++-
 3 files changed, 377 insertions(+), 25 deletions(-)

diff --git a/frontend/app/view/waveai/waveaiusechat.tsx b/frontend/app/view/waveai/waveaiusechat.tsx
index 3a3041639c..900c37933f 100644
--- a/frontend/app/view/waveai/waveaiusechat.tsx
+++ b/frontend/app/view/waveai/waveaiusechat.tsx
@@ -2,7 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 
 import { Button } from "@/app/element/button";
-import { Markdown } from "@/app/element/markdown";
+import { Streamdown } from "streamdown";
 import { TypingIndicator } from "@/app/element/typingindicator";
 import { atoms, fetchWaveFile, WOS } from "@/store/global";
 import { BlockService, ObjectService } from "@/store/services";
@@ -362,12 +362,9 @@ const ChatItem = memo(
             return (
                 <div className="flex items-start gap-3 justify-end">
                     <div className="bg-accent/15 rounded-lg p-3 max-w-[85%] ml-auto">
-                        <Markdown
-                            text={content}
-                            scrollable={false}
-                            fontSizeOverride={fontSize ? parseInt(fontSize) : undefined}
-                            fixedFontSizeOverride={fixedFontSize ? parseInt(fixedFontSize) : undefined}
-                        />
+                        <Streamdown className="size-full [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">
+                            {content}
+                        </Streamdown>
                     </div>
                     <div className="flex-shrink-0 w-8 h-8 bg-accent/10 rounded-md flex items-center justify-center">
                         <i className="fa-sharp fa-solid fa-user text-accent"></i>
@@ -384,26 +381,20 @@ const ChatItem = memo(
                     </div>
                     <div className="flex flex-col gap-2 max-w-[85%]">
                         {reasoning && (
-                            <div className="bg-yellow-50 border border-yellow-200 rounded-lg p-3">
+                            <div className="bg-accent/10 border border-accent/20 rounded-lg p-3">
                                 <div className="flex items-center gap-2 mb-2">
-                                    <i className="fa-sharp fa-solid fa-brain text-yellow-600 text-sm"></i>
-                                    <span className="text-yellow-800 text-sm font-medium">Reasoning</span>
+                                    <i className="fa-sharp fa-solid fa-brain text-accent text-sm"></i>
+                                    <span className="text-foreground text-sm font-medium">Reasoning</span>
                                 </div>
-                                <Markdown
-                                    text={reasoning}
-                                    scrollable={false}
-                                    fontSizeOverride={fontSize ? parseInt(fontSize) : undefined}
-                                    fixedFontSizeOverride={fixedFontSize ? parseInt(fixedFontSize) : undefined}
-                                />
+                                <Streamdown className="size-full [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">
+                                    {reasoning}
+                                </Streamdown>
                             </div>
                         )}
                         <div className="bg-secondary/10 rounded-lg p-3">
-                            <Markdown
-                                text={content}
-                                scrollable={false}
-                                fontSizeOverride={fontSize ? parseInt(fontSize) : undefined}
-                                fixedFontSizeOverride={fixedFontSize ? parseInt(fixedFontSize) : undefined}
-                            />
+                            <Streamdown className="size-full [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">
+                                {content}
+                            </Streamdown>
                         </div>
                     </div>
                 </div>
diff --git a/package.json b/package.json
index 7ba0673843..7d018e4cc4 100644
--- a/package.json
+++ b/package.json
@@ -153,6 +153,7 @@
         "rxjs": "^7.8.2",
         "shell-quote": "^1.8.3",
         "sprintf-js": "^1.1.3",
+        "streamdown": "^1.0.11",
         "tailwind-merge": "^3.3.1",
         "throttle-debounce": "^5.0.2",
         "tinycolor2": "^1.6.0",
diff --git a/yarn.lock b/yarn.lock
index 59836a5d6a..6b72c50272 100644
--- a/yarn.lock
+++ b/yarn.lock
@@ -4862,6 +4862,74 @@ __metadata:
   languageName: node
   linkType: hard
 
+"@shikijs/core@npm:3.11.0":
+  version: 3.11.0
+  resolution: "@shikijs/core@npm:3.11.0"
+  dependencies:
+    "@shikijs/types": "npm:3.11.0"
+    "@shikijs/vscode-textmate": "npm:^10.0.2"
+    "@types/hast": "npm:^3.0.4"
+    hast-util-to-html: "npm:^9.0.5"
+  checksum: 10c0/5ef0bbfc7d1a73fa9d71c348b28e801273cc0a909c80aebd7a0c6746c832cdcd5039d4b28748d3e288d84ed021c67415b0f0b30b3032b2a107ade4b41f6e2bd3
+  languageName: node
+  linkType: hard
+
+"@shikijs/engine-javascript@npm:3.11.0":
+  version: 3.11.0
+  resolution: "@shikijs/engine-javascript@npm:3.11.0"
+  dependencies:
+    "@shikijs/types": "npm:3.11.0"
+    "@shikijs/vscode-textmate": "npm:^10.0.2"
+    oniguruma-to-es: "npm:^4.3.3"
+  checksum: 10c0/6ddefa467ef890f075c6502991e428ca17356c69d8e8f354755a86c69853430b50ad8b2f06abb28ba40f793b3dbf9a86d9cc231527a7a96d14f13dd2a61366bc
+  languageName: node
+  linkType: hard
+
+"@shikijs/engine-oniguruma@npm:3.11.0":
+  version: 3.11.0
+  resolution: "@shikijs/engine-oniguruma@npm:3.11.0"
+  dependencies:
+    "@shikijs/types": "npm:3.11.0"
+    "@shikijs/vscode-textmate": "npm:^10.0.2"
+  checksum: 10c0/bacad748f0526fbbf5cf0ea22f60c76d93774a925898cebfb5fc9ae681a52ef47f09a6fc3e20aef8eb879a8200527cecb1897a67825f09c81059a903762dc6d2
+  languageName: node
+  linkType: hard
+
+"@shikijs/langs@npm:3.11.0":
+  version: 3.11.0
+  resolution: "@shikijs/langs@npm:3.11.0"
+  dependencies:
+    "@shikijs/types": "npm:3.11.0"
+  checksum: 10c0/6eb1e9ba28a319da9ea402881d520f52907b98254cfc9c39d70301557c1a7eb2fc2a0e7f3ef0f7fd91707d92ee8c34d2afd80af6b3f478787a710ae30a71a531
+  languageName: node
+  linkType: hard
+
+"@shikijs/themes@npm:3.11.0":
+  version: 3.11.0
+  resolution: "@shikijs/themes@npm:3.11.0"
+  dependencies:
+    "@shikijs/types": "npm:3.11.0"
+  checksum: 10c0/825576620d9a696a0da799453081117815738cb63109117e980a88775f9740e8eed428173983fb0a0c902e16f3254af23f19483c5470e40509f9f70065b17706
+  languageName: node
+  linkType: hard
+
+"@shikijs/types@npm:3.11.0":
+  version: 3.11.0
+  resolution: "@shikijs/types@npm:3.11.0"
+  dependencies:
+    "@shikijs/vscode-textmate": "npm:^10.0.2"
+    "@types/hast": "npm:^3.0.4"
+  checksum: 10c0/a209a84d86d8501091a06198cf11f79fc6485bb836554e96d5b3e04a7043c1a993e46a858b32a3117328becfa93c24fef1c716ead0919ae5b2677078ffb11eaf
+  languageName: node
+  linkType: hard
+
+"@shikijs/vscode-textmate@npm:^10.0.2":
+  version: 10.0.2
+  resolution: "@shikijs/vscode-textmate@npm:10.0.2"
+  checksum: 10c0/36b682d691088ec244de292dc8f91b808f95c89466af421cf84cbab92230f03c8348649c14b3251991b10ce632b0c715e416e992dd5f28ff3221dc2693fd9462
+  languageName: node
+  linkType: hard
+
 "@shuding/opentype.js@npm:1.4.0-beta.0":
   version: 1.4.0-beta.0
   resolution: "@shuding/opentype.js@npm:1.4.0-beta.0"
@@ -6333,7 +6401,7 @@ __metadata:
   languageName: node
   linkType: hard
 
-"@types/hast@npm:^3.0.0":
+"@types/hast@npm:^3.0.0, @types/hast@npm:^3.0.4":
   version: 3.0.4
   resolution: "@types/hast@npm:3.0.4"
   dependencies:
@@ -6418,6 +6486,13 @@ __metadata:
   languageName: node
   linkType: hard
 
+"@types/katex@npm:^0.16.0":
+  version: 0.16.7
+  resolution: "@types/katex@npm:0.16.7"
+  checksum: 10c0/68dcb9f68a90513ec78ca0196a142e15c2a2c270b1520d752bafd47a99207115085a64087b50140359017d7e9c870b3c68e7e4d36668c9e348a9ef0c48919b5a
+  languageName: node
+  linkType: hard
+
 "@types/keyv@npm:^3.1.4":
   version: 3.1.4
   resolution: "@types/keyv@npm:3.1.4"
@@ -12561,6 +12636,16 @@ __metadata:
   languageName: node
   linkType: hard
 
+"harden-react-markdown@npm:^1.0.4":
+  version: 1.0.4
+  resolution: "harden-react-markdown@npm:1.0.4"
+  peerDependencies:
+    react: ">=16.8.0"
+    react-markdown: ">=9.0.0"
+  checksum: 10c0/4a71cc176544ef27e6557e7538c0f170603e32773e6d223afca92d0ef3027f9afcd0fbca3cfef1bc0fe855f03d1959955eac043fc568d6bef970cfe72fc09ef9
+  languageName: node
+  linkType: hard
+
 "has-flag@npm:^4.0.0":
   version: 4.0.0
   resolution: "has-flag@npm:4.0.0"
@@ -12623,6 +12708,43 @@ __metadata:
   languageName: node
   linkType: hard
 
+"hast-util-from-dom@npm:^5.0.0":
+  version: 5.0.1
+  resolution: "hast-util-from-dom@npm:5.0.1"
+  dependencies:
+    "@types/hast": "npm:^3.0.0"
+    hastscript: "npm:^9.0.0"
+    web-namespaces: "npm:^2.0.0"
+  checksum: 10c0/9a90381e048107a093a3da758bb17b67aaf5322e222f02497f841c4990abf94aa177d38d5b9bf61ad07b3601d0409f34f5b556d89578cc189230c6b994d2af77
+  languageName: node
+  linkType: hard
+
+"hast-util-from-html-isomorphic@npm:^2.0.0":
+  version: 2.0.0
+  resolution: "hast-util-from-html-isomorphic@npm:2.0.0"
+  dependencies:
+    "@types/hast": "npm:^3.0.0"
+    hast-util-from-dom: "npm:^5.0.0"
+    hast-util-from-html: "npm:^2.0.0"
+    unist-util-remove-position: "npm:^5.0.0"
+  checksum: 10c0/fc68d9245e794483a802d5c85a9f6c25959e00db78cc796411efc965134f3206f9cc9fa38134572ea781ad74663e801f1f83202007b208e27a770855566a62b6
+  languageName: node
+  linkType: hard
+
+"hast-util-from-html@npm:^2.0.0":
+  version: 2.0.3
+  resolution: "hast-util-from-html@npm:2.0.3"
+  dependencies:
+    "@types/hast": "npm:^3.0.0"
+    devlop: "npm:^1.1.0"
+    hast-util-from-parse5: "npm:^8.0.0"
+    parse5: "npm:^7.0.0"
+    vfile: "npm:^6.0.0"
+    vfile-message: "npm:^4.0.0"
+  checksum: 10c0/993ef707c1a12474c8d4094fc9706a72826c660a7e308ea54c50ad893353d32e139b7cbc67510c2e82feac572b320e3b05aeb13d0f9c6302d61261f337b46764
+  languageName: node
+  linkType: hard
+
 "hast-util-from-parse5@npm:^8.0.0":
   version: 8.0.1
   resolution: "hast-util-from-parse5@npm:8.0.1"
@@ -12722,6 +12844,25 @@ __metadata:
   languageName: node
   linkType: hard
 
+"hast-util-to-html@npm:^9.0.5":
+  version: 9.0.5
+  resolution: "hast-util-to-html@npm:9.0.5"
+  dependencies:
+    "@types/hast": "npm:^3.0.0"
+    "@types/unist": "npm:^3.0.0"
+    ccount: "npm:^2.0.0"
+    comma-separated-tokens: "npm:^2.0.0"
+    hast-util-whitespace: "npm:^3.0.0"
+    html-void-elements: "npm:^3.0.0"
+    mdast-util-to-hast: "npm:^13.0.0"
+    property-information: "npm:^7.0.0"
+    space-separated-tokens: "npm:^2.0.0"
+    stringify-entities: "npm:^4.0.0"
+    zwitch: "npm:^2.0.4"
+  checksum: 10c0/b7a08c30bab4371fc9b4a620965c40b270e5ae7a8e94cf885f43b21705179e28c8e43b39c72885d1647965fb3738654e6962eb8b58b0c2a84271655b4d748836
+  languageName: node
+  linkType: hard
+
 "hast-util-to-jsx-runtime@npm:^2.0.0":
   version: 2.3.2
   resolution: "hast-util-to-jsx-runtime@npm:2.3.2"
@@ -12803,6 +12944,19 @@ __metadata:
   languageName: node
   linkType: hard
 
+"hastscript@npm:^9.0.0":
+  version: 9.0.1
+  resolution: "hastscript@npm:9.0.1"
+  dependencies:
+    "@types/hast": "npm:^3.0.0"
+    comma-separated-tokens: "npm:^2.0.0"
+    hast-util-parse-selector: "npm:^4.0.0"
+    property-information: "npm:^7.0.0"
+    space-separated-tokens: "npm:^2.0.0"
+  checksum: 10c0/18dc8064e5c3a7a2ae862978e626b97a254e1c8a67ee9d0c9f06d373bba155ed805fc5b5ce21b990fb7bc174624889e5e1ce1cade264f1b1d58b48f994bc85ce
+  languageName: node
+  linkType: hard
+
 "he@npm:1.2.0, he@npm:^1.2.0":
   version: 1.2.0
   resolution: "he@npm:1.2.0"
@@ -14124,6 +14278,17 @@ __metadata:
   languageName: node
   linkType: hard
 
+"katex@npm:^0.16.0, katex@npm:^0.16.22":
+  version: 0.16.22
+  resolution: "katex@npm:0.16.22"
+  dependencies:
+    commander: "npm:^8.3.0"
+  bin:
+    katex: cli.js
+  checksum: 10c0/07b8b1f07ae53171b5f1ea0cf6f18841d2055825c8b11cd81cfe039afcd3af2cfc84ad033531ee3875088329105195b039c267e0dd4b0c237807e3c3b2009913
+  languageName: node
+  linkType: hard
+
 "keyv@npm:^4.0.0, keyv@npm:^4.5.3":
   version: 4.5.4
   resolution: "keyv@npm:4.5.4"
@@ -14569,6 +14734,15 @@ __metadata:
   languageName: node
   linkType: hard
 
+"lucide-react@npm:^0.539.0":
+  version: 0.539.0
+  resolution: "lucide-react@npm:0.539.0"
+  peerDependencies:
+    react: ^16.5.1 || ^17.0.0 || ^18.0.0 || ^19.0.0
+  checksum: 10c0/ae85244dc23a78c51cc5f829ee09321cf68201333ab3d5614ed73cda77a4cd12284d3630a5a2167a39e31e02811056336de76a597c6874b28bb9984baf876494
+  languageName: node
+  linkType: hard
+
 "lz-string@npm:^1.5.0":
   version: 1.5.0
   resolution: "lz-string@npm:1.5.0"
@@ -14706,6 +14880,15 @@ __metadata:
   languageName: node
   linkType: hard
 
+"marked@npm:^16.1.2":
+  version: 16.2.0
+  resolution: "marked@npm:16.2.0"
+  bin:
+    marked: bin/marked.js
+  checksum: 10c0/aefc418370e916ffeb821d05a585f4311c529268880113ee3695857bfb335119b5b4cd202a5d198fc087f7f3c59f98170ba1994027b2a9b8a172b31e3047ca3a
+  languageName: node
+  linkType: hard
+
 "matcher@npm:^3.0.0":
   version: 3.0.0
   resolution: "matcher@npm:3.0.0"
@@ -14893,6 +15076,21 @@ __metadata:
   languageName: node
   linkType: hard
 
+"mdast-util-math@npm:^3.0.0":
+  version: 3.0.0
+  resolution: "mdast-util-math@npm:3.0.0"
+  dependencies:
+    "@types/hast": "npm:^3.0.0"
+    "@types/mdast": "npm:^4.0.0"
+    devlop: "npm:^1.0.0"
+    longest-streak: "npm:^3.0.0"
+    mdast-util-from-markdown: "npm:^2.0.0"
+    mdast-util-to-markdown: "npm:^2.1.0"
+    unist-util-remove-position: "npm:^5.0.0"
+  checksum: 10c0/d4e839e38719f26872ed78aac18339805a892f1b56585a9cb8668f34e221b4f0660b9dfe49ec96dbbe79fd1b63b648608a64046d8286bcd2f9d576e80b48a0a1
+  languageName: node
+  linkType: hard
+
 "mdast-util-mdx-expression@npm:^2.0.0":
   version: 2.0.1
   resolution: "mdast-util-mdx-expression@npm:2.0.1"
@@ -14981,7 +15179,7 @@ __metadata:
   languageName: node
   linkType: hard
 
-"mdast-util-to-markdown@npm:^2.0.0":
+"mdast-util-to-markdown@npm:^2.0.0, mdast-util-to-markdown@npm:^2.1.0":
   version: 2.1.2
   resolution: "mdast-util-to-markdown@npm:2.1.2"
   dependencies:
@@ -15239,6 +15437,21 @@ __metadata:
   languageName: node
   linkType: hard
 
+"micromark-extension-math@npm:^3.0.0":
+  version: 3.1.0
+  resolution: "micromark-extension-math@npm:3.1.0"
+  dependencies:
+    "@types/katex": "npm:^0.16.0"
+    devlop: "npm:^1.0.0"
+    katex: "npm:^0.16.0"
+    micromark-factory-space: "npm:^2.0.0"
+    micromark-util-character: "npm:^2.0.0"
+    micromark-util-symbol: "npm:^2.0.0"
+    micromark-util-types: "npm:^2.0.0"
+  checksum: 10c0/56e6f2185a4613f9d47e7e98cf8605851c990957d9229c942b005e286c8087b61dc9149448d38b2f8be6d42cc6a64aad7e1f2778ddd86fbbb1a2f48a3ca1872f
+  languageName: node
+  linkType: hard
+
 "micromark-extension-mdx-expression@npm:^3.0.0":
   version: 3.0.0
   resolution: "micromark-extension-mdx-expression@npm:3.0.0"
@@ -16407,6 +16620,24 @@ __metadata:
   languageName: node
   linkType: hard
 
+"oniguruma-parser@npm:^0.12.1":
+  version: 0.12.1
+  resolution: "oniguruma-parser@npm:0.12.1"
+  checksum: 10c0/b843ea54cda833efb19f856314afcbd43e903ece3de489ab78c527ddec84859208052557daa9fad4bdba89ebdd15b0cc250de86b3daf8c7cbe37bac5a6a185d3
+  languageName: node
+  linkType: hard
+
+"oniguruma-to-es@npm:^4.3.3":
+  version: 4.3.3
+  resolution: "oniguruma-to-es@npm:4.3.3"
+  dependencies:
+    oniguruma-parser: "npm:^0.12.1"
+    regex: "npm:^6.0.1"
+    regex-recursion: "npm:^6.0.2"
+  checksum: 10c0/bc034e84dfee4dbc061cf6364023e66e1667fb8dc3afcad3b7d6a2c77e2d4a4809396ee2fb8c1fd3d6f00f76f7ca14b773586bf862c5f0c0074c059e2a219252
+  languageName: node
+  linkType: hard
+
 "open@npm:^8.0.4, open@npm:^8.0.9, open@npm:^8.4.0":
   version: 8.4.2
   resolution: "open@npm:8.4.2"
@@ -17991,6 +18222,13 @@ __metadata:
   languageName: node
   linkType: hard
 
+"property-information@npm:^7.0.0":
+  version: 7.1.0
+  resolution: "property-information@npm:7.1.0"
+  checksum: 10c0/e0fe22cff26103260ad0e82959229106563fa115a54c4d6c183f49d88054e489cc9f23452d3ad584179dc13a8b7b37411a5df873746b5e4086c865874bfa968e
+  languageName: node
+  linkType: hard
+
 "proto-list@npm:~1.2.1":
   version: 1.2.4
   resolution: "proto-list@npm:1.2.4"
@@ -18364,6 +18602,28 @@ __metadata:
   languageName: node
   linkType: hard
 
+"react-markdown@npm:^10.1.0":
+  version: 10.1.0
+  resolution: "react-markdown@npm:10.1.0"
+  dependencies:
+    "@types/hast": "npm:^3.0.0"
+    "@types/mdast": "npm:^4.0.0"
+    devlop: "npm:^1.0.0"
+    hast-util-to-jsx-runtime: "npm:^2.0.0"
+    html-url-attributes: "npm:^3.0.0"
+    mdast-util-to-hast: "npm:^13.0.0"
+    remark-parse: "npm:^11.0.0"
+    remark-rehype: "npm:^11.0.0"
+    unified: "npm:^11.0.0"
+    unist-util-visit: "npm:^5.0.0"
+    vfile: "npm:^6.0.0"
+  peerDependencies:
+    "@types/react": ">=18"
+    react: ">=18"
+  checksum: 10c0/4a5dc7d15ca6d05e9ee95318c1904f83b111a76f7588c44f50f1d54d4c97193b84e4f64c4b592057c989228238a2590306cedd0c4d398e75da49262b2b5ae1bf
+  languageName: node
+  linkType: hard
+
 "react-markdown@npm:^9.0.3":
   version: 9.0.3
   resolution: "react-markdown@npm:9.0.3"
@@ -18730,6 +18990,31 @@ __metadata:
   languageName: node
   linkType: hard
 
+"regex-recursion@npm:^6.0.2":
+  version: 6.0.2
+  resolution: "regex-recursion@npm:6.0.2"
+  dependencies:
+    regex-utilities: "npm:^2.3.0"
+  checksum: 10c0/68e8b6889680e904b75d7f26edaf70a1a4dc1087406bff53face4c2929d918fd77c72223843fe816ac8ed9964f96b4160650e8d5909e26a998c6e9de324dadb1
+  languageName: node
+  linkType: hard
+
+"regex-utilities@npm:^2.3.0":
+  version: 2.3.0
+  resolution: "regex-utilities@npm:2.3.0"
+  checksum: 10c0/78c550a80a0af75223244fff006743922591bd8f61d91fef7c86b9b56cf9bbf8ee5d7adb6d8991b5e304c57c90103fc4818cf1e357b11c6c669b782839bd7893
+  languageName: node
+  linkType: hard
+
+"regex@npm:^6.0.1":
+  version: 6.0.1
+  resolution: "regex@npm:6.0.1"
+  dependencies:
+    regex-utilities: "npm:^2.3.0"
+  checksum: 10c0/687b3e063d4ca19b0de7c55c24353f868a0fb9ba21512692470d2fb412e3a410894dd5924c91ea49d8cb8fa865e36ec956e52436ae0a256bdc095ff136c30aba
+  languageName: node
+  linkType: hard
+
 "regexpu-core@npm:^6.1.1":
   version: 6.1.1
   resolution: "regexpu-core@npm:6.1.1"
@@ -18793,6 +19078,21 @@ __metadata:
   languageName: node
   linkType: hard
 
+"rehype-katex@npm:^7.0.1":
+  version: 7.0.1
+  resolution: "rehype-katex@npm:7.0.1"
+  dependencies:
+    "@types/hast": "npm:^3.0.0"
+    "@types/katex": "npm:^0.16.0"
+    hast-util-from-html-isomorphic: "npm:^2.0.0"
+    hast-util-to-text: "npm:^4.0.0"
+    katex: "npm:^0.16.0"
+    unist-util-visit-parents: "npm:^6.0.0"
+    vfile: "npm:^6.0.0"
+  checksum: 10c0/73c770319536128b75055d904d06951789d00a0552c11724c0dac2e244dcb21041630552d118a11cc42233fdcd1bfee525e78a0020fde635bd916cceb281dfb1
+  languageName: node
+  linkType: hard
+
 "rehype-raw@npm:^7.0.0":
   version: 7.0.0
   resolution: "rehype-raw@npm:7.0.0"
@@ -19303,6 +19603,18 @@ __metadata:
   languageName: node
   linkType: hard
 
+"remark-math@npm:^6.0.0":
+  version: 6.0.0
+  resolution: "remark-math@npm:6.0.0"
+  dependencies:
+    "@types/mdast": "npm:^4.0.0"
+    mdast-util-math: "npm:^3.0.0"
+    micromark-extension-math: "npm:^3.0.0"
+    unified: "npm:^11.0.0"
+  checksum: 10c0/859613c4db194bb6b3c9c063661dc52b8ceda9c5cf3256b42f73d93eb8f38a6d634eb5f976fe094425f6f1035aaf329eb49ada314feb3b2b1073326b6d3aaa02
+  languageName: node
+  linkType: hard
+
 "remark-mdx@npm:^3.0.0, remark-mdx@npm:^3.1.0":
   version: 3.1.0
   resolution: "remark-mdx@npm:3.1.0"
@@ -20181,6 +20493,22 @@ __metadata:
   languageName: node
   linkType: hard
 
+"shiki@npm:^3.9.2":
+  version: 3.11.0
+  resolution: "shiki@npm:3.11.0"
+  dependencies:
+    "@shikijs/core": "npm:3.11.0"
+    "@shikijs/engine-javascript": "npm:3.11.0"
+    "@shikijs/engine-oniguruma": "npm:3.11.0"
+    "@shikijs/langs": "npm:3.11.0"
+    "@shikijs/themes": "npm:3.11.0"
+    "@shikijs/types": "npm:3.11.0"
+    "@shikijs/vscode-textmate": "npm:^10.0.2"
+    "@types/hast": "npm:^3.0.4"
+  checksum: 10c0/27f208e3980175346e68995116183005561ecb410ab21be365667d408ec515ee2ba5d8fb50cfa8a66578906b4bab48fb19ff2b47c13729afe01311fd446007cb
+  languageName: node
+  linkType: hard
+
 "side-channel@npm:^1.0.6":
   version: 1.0.6
   resolution: "side-channel@npm:1.0.6"
@@ -20611,6 +20939,27 @@ __metadata:
   languageName: node
   linkType: hard
 
+"streamdown@npm:^1.0.11":
+  version: 1.0.11
+  resolution: "streamdown@npm:1.0.11"
+  dependencies:
+    clsx: "npm:^2.1.1"
+    harden-react-markdown: "npm:^1.0.4"
+    katex: "npm:^0.16.22"
+    lucide-react: "npm:^0.539.0"
+    marked: "npm:^16.1.2"
+    react-markdown: "npm:^10.1.0"
+    rehype-katex: "npm:^7.0.1"
+    remark-gfm: "npm:^4.0.1"
+    remark-math: "npm:^6.0.0"
+    shiki: "npm:^3.9.2"
+    tailwind-merge: "npm:^3.3.1"
+  peerDependencies:
+    react: ^19.1.1
+  checksum: 10c0/79460c35cb0d2ab6a5abbcae414a3def046458ba6450d8b7e8780dfca1612f64f12bb2f1f1cc6fbe93caa38664eff28f06c8f11338786dac67e2c566eb75c080
+  languageName: node
+  linkType: hard
+
 "streamx@npm:^2.15.0, streamx@npm:^2.20.0":
   version: 2.20.1
   resolution: "streamx@npm:2.20.1"
@@ -21783,6 +22132,16 @@ __metadata:
   languageName: node
   linkType: hard
 
+"unist-util-remove-position@npm:^5.0.0":
+  version: 5.0.0
+  resolution: "unist-util-remove-position@npm:5.0.0"
+  dependencies:
+    "@types/unist": "npm:^3.0.0"
+    unist-util-visit: "npm:^5.0.0"
+  checksum: 10c0/e8c76da4399446b3da2d1c84a97c607b37d03d1d92561e14838cbe4fdcb485bfc06c06cfadbb808ccb72105a80643976d0660d1fe222ca372203075be9d71105
+  languageName: node
+  linkType: hard
+
 "unist-util-stringify-position@npm:^2.0.0":
   version: 2.0.3
   resolution: "unist-util-stringify-position@npm:2.0.3"
@@ -22621,6 +22980,7 @@ __metadata:
     sprintf-js: "npm:^1.1.3"
     storybook: "npm:^8.5.8"
     storybook-dark-mode: "npm:^4.0.2"
+    streamdown: "npm:^1.0.11"
     tailwind-merge: "npm:^3.3.1"
     tailwindcss: "npm:^4.1.12"
     tailwindcss-animate: "npm:^1.0.7"
@@ -23213,7 +23573,7 @@ __metadata:
   languageName: node
   linkType: hard
 
-"zwitch@npm:^2.0.0":
+"zwitch@npm:^2.0.0, zwitch@npm:^2.0.4":
   version: 2.0.4
   resolution: "zwitch@npm:2.0.4"
   checksum: 10c0/3c7830cdd3378667e058ffdb4cf2bb78ac5711214e2725900873accb23f3dfe5f9e7e5a06dcdc5f29605da976fc45c26d9a13ca334d6eea2245a15e77b8fc06e

From e63160ccadeeab3eb41981288acdb530892209ff Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 16:07:31 -0700
Subject: [PATCH 26/29] fix out of order responses

---
 pkg/waveai/usechat-openai-responses.go | 9 ++++++---
 1 file changed, 6 insertions(+), 3 deletions(-)

diff --git a/pkg/waveai/usechat-openai-responses.go b/pkg/waveai/usechat-openai-responses.go
index bb7d19706e..2b9ee2ae51 100644
--- a/pkg/waveai/usechat-openai-responses.go
+++ b/pkg/waveai/usechat-openai-responses.go
@@ -121,7 +121,7 @@ func StreamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 
 		case "response.reasoning_summary_text.delta":
 			reasoningDelta := event.AsResponseReasoningSummaryTextDelta()
-			if reasoningDelta.Delta != "" {
+			if reasoningDelta.Delta != "" && !reasoningEnded {
 				sseHandler.AiMsgReasoningDelta(reasoningId, reasoningDelta.Delta)
 			}
 
@@ -142,7 +142,7 @@ func StreamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 
 		case "response.output_text.delta":
 			textDelta := event.AsResponseOutputTextDelta()
-			if textDelta.Delta != "" {
+			if textDelta.Delta != "" && !textEnded {
 				if !textStarted {
 					sseHandler.AiMsgTextStart(textId)
 					textStarted = true
@@ -151,7 +151,10 @@ func StreamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 			}
 
 		case "response.output_text.done":
-			// Finalize text if needed
+			if textStarted && !textEnded {
+				sseHandler.AiMsgTextEnd(textId)
+				textEnded = true
+			}
 
 		case "response.output_item.done":
 			// Item-level close (reasoning or message)

From ba9664623dab1d09426d1e188f3a9fb26fc19c19 Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 16:11:46 -0700
Subject: [PATCH 27/29] fix for reasoning parts

---
 pkg/waveai/usechat-openai-responses.go | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/pkg/waveai/usechat-openai-responses.go b/pkg/waveai/usechat-openai-responses.go
index 2b9ee2ae51..678de3feae 100644
--- a/pkg/waveai/usechat-openai-responses.go
+++ b/pkg/waveai/usechat-openai-responses.go
@@ -105,7 +105,7 @@ func StreamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 	for stream.Next() {
 		event := stream.Current()
 
-		// fmt.Printf("DEBUG: Received event type: %s\n", event.Type)
+		fmt.Printf("DEBUG: Received event type: %s\n", event.Type)
 
 		switch event.Type {
 		case "response.output_item.added":
@@ -121,15 +121,15 @@ func StreamOpenAIResponsesAPI(sseHandler *SSEHandlerCh, ctx context.Context, opt
 
 		case "response.reasoning_summary_text.delta":
 			reasoningDelta := event.AsResponseReasoningSummaryTextDelta()
+			fmt.Printf("DEBUG: reasoning delta - reasoningEnded=%t, delta='%s'\n", reasoningEnded, reasoningDelta.Delta)
 			if reasoningDelta.Delta != "" && !reasoningEnded {
 				sseHandler.AiMsgReasoningDelta(reasoningId, reasoningDelta.Delta)
 			}
 
 		case "response.reasoning_summary_text.done":
-			if reasoningStarted && !reasoningEnded {
-				sseHandler.AiMsgReasoningEnd(reasoningId)
-				reasoningEnded = true
-			}
+			fmt.Printf("DEBUG: reasoning summary text done - reasoningStarted=%t, reasoningEnded=%t (not ending here, waiting for output_item.done)\n", reasoningStarted, reasoningEnded)
+			// Don't end reasoning here - there may be multiple reasoning parts
+			// Wait for response.output_item.done to end reasoning
 
 		case "response.reasoning_summary_part.done":
 			// Reasoning summary part done - no action needed

From d97481022c20a4d211b8350a7159578ff5a9041b Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 16:20:36 -0700
Subject: [PATCH 28/29] working on UX + states

---
 frontend/app/view/waveai/reasoning.tsx     | 163 +++++++++++++++++++++
 frontend/app/view/waveai/waveaiusechat.tsx |  52 ++++---
 2 files changed, 194 insertions(+), 21 deletions(-)
 create mode 100644 frontend/app/view/waveai/reasoning.tsx

diff --git a/frontend/app/view/waveai/reasoning.tsx b/frontend/app/view/waveai/reasoning.tsx
new file mode 100644
index 0000000000..6f5459b17e
--- /dev/null
+++ b/frontend/app/view/waveai/reasoning.tsx
@@ -0,0 +1,163 @@
+// Copyright 2025, Command Line Inc.
+// SPDX-License-Identifier: Apache-2.0
+
+import { Streamdown } from "streamdown";
+import React, { createContext, memo, useCallback, useContext, useEffect, useState } from "react";
+
+type ReasoningContextValue = {
+    isStreaming: boolean;
+    isOpen: boolean;
+    setIsOpen: (open: boolean) => void;
+    duration: number;
+};
+
+const ReasoningContext = createContext<ReasoningContextValue | null>(null);
+
+const useReasoning = () => {
+    const context = useContext(ReasoningContext);
+    if (!context) {
+        throw new Error('Reasoning components must be used within Reasoning');
+    }
+    return context;
+};
+
+const AUTO_CLOSE_DELAY = 1000;
+
+export const Reasoning = memo(
+    ({
+        className,
+        isStreaming = false,
+        open,
+        defaultOpen = false,
+        onOpenChange,
+        duration: durationProp = 3,
+        children,
+    }: {
+        className?: string;
+        isStreaming?: boolean;
+        open?: boolean;
+        defaultOpen?: boolean;
+        onOpenChange?: (open: boolean) => void;
+        duration?: number;
+        children: React.ReactNode;
+    }) => {
+        const [isOpen, setIsOpenState] = useState(defaultOpen);
+        const [duration, setDuration] = useState(durationProp);
+        const [hasAutoClosedRef, setHasAutoClosedRef] = useState(false);
+        const [startTime, setStartTime] = useState<number | null>(null);
+
+        const setIsOpen = useCallback((newOpen: boolean) => {
+            setIsOpenState(newOpen);
+            onOpenChange?.(newOpen);
+        }, [onOpenChange]);
+
+        // Track duration when streaming starts and ends
+        useEffect(() => {
+            if (isStreaming) {
+                if (startTime === null) {
+                    setStartTime(Date.now());
+                }
+            } else if (startTime !== null) {
+                setDuration(Math.round((Date.now() - startTime) / 1000));
+                setStartTime(null);
+            }
+        }, [isStreaming, startTime]);
+
+        // Auto-open when streaming starts, auto-close when streaming ends (once only)
+        useEffect(() => {
+            if (isStreaming && !isOpen) {
+                setIsOpen(true);
+            } else if (!isStreaming && isOpen && !defaultOpen && !hasAutoClosedRef) {
+                const timer = setTimeout(() => {
+                    setIsOpen(false);
+                    setHasAutoClosedRef(true);
+                }, AUTO_CLOSE_DELAY);
+                return () => clearTimeout(timer);
+            }
+        }, [isStreaming, isOpen, defaultOpen, setIsOpen, hasAutoClosedRef]);
+
+        // Handle controlled open state
+        useEffect(() => {
+            if (open !== undefined) {
+                setIsOpenState(open);
+            }
+        }, [open]);
+
+        return (
+            <ReasoningContext.Provider
+                value={{ isStreaming, isOpen, setIsOpen, duration }}
+            >
+                <div className={`not-prose ${className || ''}`}>
+                    {children}
+                </div>
+            </ReasoningContext.Provider>
+        );
+    }
+);
+
+export const ReasoningTrigger = memo(
+    ({
+        className,
+        title = 'Reasoning',
+        children,
+        onClick,
+    }: {
+        className?: string;
+        title?: string;
+        children?: React.ReactNode;
+        onClick?: () => void;
+    }) => {
+        const { isStreaming, isOpen, setIsOpen, duration } = useReasoning();
+
+        const handleClick = useCallback(() => {
+            setIsOpen(!isOpen);
+            onClick?.();
+        }, [isOpen, setIsOpen, onClick]);
+
+        return (
+            <button
+                className={`flex items-center gap-2 text-muted-foreground text-sm cursor-pointer ${className || ''}`}
+                onClick={handleClick}
+            >
+                {children ?? (
+                    <>
+                        {isStreaming || duration === 0 ? (
+                            <p>Thinking...</p>
+                        ) : (
+                            <p>Thought for {duration} seconds</p>
+                        )}
+                        <i
+                            className={`fa-sharp fa-solid fa-chevron-down text-sm transition-transform ${
+                                isOpen ? 'rotate-180' : 'rotate-0'
+                            }`}
+                        />
+                    </>
+                )}
+            </button>
+        );
+    }
+);
+
+export const ReasoningContent = memo(
+    ({ className, children }: { className?: string; children: string }) => {
+        const { isOpen } = useReasoning();
+
+        if (!isOpen) return null;
+
+        return (
+            <div
+                className={`mt-4 text-sm transition-all duration-200 ease-in-out ${
+                    isOpen ? 'animate-in slide-in-from-top-2' : 'animate-out slide-out-to-top-2'
+                } text-popover-foreground outline-none ${className || ''}`}
+            >
+                <Streamdown className="grid gap-2 [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">
+                    {children}
+                </Streamdown>
+            </div>
+        );
+    }
+);
+
+Reasoning.displayName = 'Reasoning';
+ReasoningTrigger.displayName = 'ReasoningTrigger';
+ReasoningContent.displayName = 'ReasoningContent';
\ No newline at end of file
diff --git a/frontend/app/view/waveai/waveaiusechat.tsx b/frontend/app/view/waveai/waveaiusechat.tsx
index 900c37933f..148b9a2795 100644
--- a/frontend/app/view/waveai/waveaiusechat.tsx
+++ b/frontend/app/view/waveai/waveaiusechat.tsx
@@ -15,6 +15,7 @@ import { atom, Atom, useAtomValue } from "jotai";
 import { OverlayScrollbarsComponent, OverlayScrollbarsComponentRef } from "overlayscrollbars-react";
 import React, { forwardRef, memo, useCallback, useEffect, useImperativeHandle, useMemo, useRef, useState } from "react";
 import { debounce, throttle } from "throttle-debounce";
+import { Reasoning, ReasoningContent, ReasoningTrigger } from "./reasoning";
 
 interface WaveAiUseChatProps {
     blockId: string;
@@ -318,14 +319,21 @@ const ChatWindow = memo(
                     events={{ scroll: handleScroll }}
                 >
                     <div className="flex flex-col gap-4 p-4">
-                        {messages.map((message) => (
-                            <ChatItem
-                                key={message.id}
-                                message={message}
-                                fontSize={fontSize}
-                                fixedFontSize={fixedFontSize}
-                            />
-                        ))}
+                        {messages.map((message, index) => {
+                            // Only the last assistant message should be streaming when isLoading is true
+                            const isLastAssistantMessage = message.role === "assistant" && index === messages.length - 1;
+                            const isCurrentlyStreaming = isLoading && isLastAssistantMessage;
+                            
+                            return (
+                                <ChatItem
+                                    key={message.id}
+                                    message={message}
+                                    fontSize={fontSize}
+                                    fixedFontSize={fixedFontSize}
+                                    isStreaming={isCurrentlyStreaming}
+                                />
+                            );
+                        })}
                         {isLoading && (
                             <div className="flex items-start gap-3">
                                 <div className="flex-shrink-0 w-8 h-8 bg-accent/10 rounded-md flex items-center justify-center">
@@ -355,7 +363,12 @@ const ChatWindow = memo(
 ChatWindow.displayName = "ChatWindow";
 
 const ChatItem = memo(
-    ({ message, fontSize, fixedFontSize }: { message: ChatMessage; fontSize?: string; fixedFontSize?: string }) => {
+    ({ message, fontSize, fixedFontSize, isStreaming = false }: {
+        message: ChatMessage;
+        fontSize?: string;
+        fixedFontSize?: string;
+        isStreaming?: boolean;
+    }) => {
         const { role, content, reasoning } = message;
 
         if (role === "user") {
@@ -380,22 +393,19 @@ const ChatItem = memo(
                         <i className="fa-sharp fa-solid fa-sparkles text-accent"></i>
                     </div>
                     <div className="flex flex-col gap-2 max-w-[85%]">
-                        {reasoning && (
-                            <div className="bg-accent/10 border border-accent/20 rounded-lg p-3">
-                                <div className="flex items-center gap-2 mb-2">
-                                    <i className="fa-sharp fa-solid fa-brain text-accent text-sm"></i>
-                                    <span className="text-foreground text-sm font-medium">Reasoning</span>
-                                </div>
+                        {(reasoning || isStreaming) && (
+                            <Reasoning isStreaming={isStreaming}>
+                                <ReasoningTrigger />
+                                <ReasoningContent>{reasoning || ""}</ReasoningContent>
+                            </Reasoning>
+                        )}
+                        {content && (
+                            <div className="bg-secondary/10 rounded-lg p-3">
                                 <Streamdown className="size-full [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">
-                                    {reasoning}
+                                    {content}
                                 </Streamdown>
                             </div>
                         )}
-                        <div className="bg-secondary/10 rounded-lg p-3">
-                            <Streamdown className="size-full [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">
-                                {content}
-                            </Streamdown>
-                        </div>
                     </div>
                 </div>
             );

From 17d865687afaa4cdc6372df028dd71ec54da69af Mon Sep 17 00:00:00 2001
From: sawka <mike@commandline.dev>
Date: Wed, 20 Aug 2025 17:05:12 -0700
Subject: [PATCH 29/29] fixing UX

---
 frontend/app/view/waveai/reasoning.tsx     | 94 +++++++++-------------
 frontend/app/view/waveai/waveaiusechat.tsx | 62 ++++++++------
 2 files changed, 74 insertions(+), 82 deletions(-)

diff --git a/frontend/app/view/waveai/reasoning.tsx b/frontend/app/view/waveai/reasoning.tsx
index 6f5459b17e..d334a4f80b 100644
--- a/frontend/app/view/waveai/reasoning.tsx
+++ b/frontend/app/view/waveai/reasoning.tsx
@@ -1,8 +1,8 @@
 // Copyright 2025, Command Line Inc.
 // SPDX-License-Identifier: Apache-2.0
 
-import { Streamdown } from "streamdown";
 import React, { createContext, memo, useCallback, useContext, useEffect, useState } from "react";
+import { Streamdown } from "streamdown";
 
 type ReasoningContextValue = {
     isStreaming: boolean;
@@ -16,7 +16,7 @@ const ReasoningContext = createContext<ReasoningContextValue | null>(null);
 const useReasoning = () => {
     const context = useContext(ReasoningContext);
     if (!context) {
-        throw new Error('Reasoning components must be used within Reasoning');
+        throw new Error("Reasoning components must be used within Reasoning");
     }
     return context;
 };
@@ -42,14 +42,17 @@ export const Reasoning = memo(
         children: React.ReactNode;
     }) => {
         const [isOpen, setIsOpenState] = useState(defaultOpen);
-        const [duration, setDuration] = useState(durationProp);
+        const [duration, setDuration] = useState(0);
         const [hasAutoClosedRef, setHasAutoClosedRef] = useState(false);
         const [startTime, setStartTime] = useState<number | null>(null);
 
-        const setIsOpen = useCallback((newOpen: boolean) => {
-            setIsOpenState(newOpen);
-            onOpenChange?.(newOpen);
-        }, [onOpenChange]);
+        const setIsOpen = useCallback(
+            (newOpen: boolean) => {
+                setIsOpenState(newOpen);
+                onOpenChange?.(newOpen);
+            },
+            [onOpenChange]
+        );
 
         // Track duration when streaming starts and ends
         useEffect(() => {
@@ -63,18 +66,7 @@ export const Reasoning = memo(
             }
         }, [isStreaming, startTime]);
 
-        // Auto-open when streaming starts, auto-close when streaming ends (once only)
-        useEffect(() => {
-            if (isStreaming && !isOpen) {
-                setIsOpen(true);
-            } else if (!isStreaming && isOpen && !defaultOpen && !hasAutoClosedRef) {
-                const timer = setTimeout(() => {
-                    setIsOpen(false);
-                    setHasAutoClosedRef(true);
-                }, AUTO_CLOSE_DELAY);
-                return () => clearTimeout(timer);
-            }
-        }, [isStreaming, isOpen, defaultOpen, setIsOpen, hasAutoClosedRef]);
+        // Don't auto-open or auto-close - let user control the state manually
 
         // Handle controlled open state
         useEffect(() => {
@@ -84,12 +76,8 @@ export const Reasoning = memo(
         }, [open]);
 
         return (
-            <ReasoningContext.Provider
-                value={{ isStreaming, isOpen, setIsOpen, duration }}
-            >
-                <div className={`not-prose ${className || ''}`}>
-                    {children}
-                </div>
+            <ReasoningContext.Provider value={{ isStreaming, isOpen, setIsOpen, duration }}>
+                <div className={`not-prose ${className || ""}`}>{children}</div>
             </ReasoningContext.Provider>
         );
     }
@@ -98,7 +86,7 @@ export const Reasoning = memo(
 export const ReasoningTrigger = memo(
     ({
         className,
-        title = 'Reasoning',
+        title = "Reasoning",
         children,
         onClick,
     }: {
@@ -116,19 +104,15 @@ export const ReasoningTrigger = memo(
 
         return (
             <button
-                className={`flex items-center gap-2 text-muted-foreground text-sm cursor-pointer ${className || ''}`}
+                className={`flex items-center gap-2 text-muted-foreground text-sm cursor-pointer ${className || ""}`}
                 onClick={handleClick}
             >
                 {children ?? (
                     <>
-                        {isStreaming || duration === 0 ? (
-                            <p>Thinking...</p>
-                        ) : (
-                            <p>Thought for {duration} seconds</p>
-                        )}
+                        {isStreaming ? <p>Thinking...</p> : <p>Thinking Done</p>}
                         <i
-                            className={`fa-sharp fa-solid fa-chevron-down text-sm transition-transform ${
-                                isOpen ? 'rotate-180' : 'rotate-0'
+                            className={`fa-sharp fa-solid fa-chevron-right text-sm transition-transform ${
+                                isOpen ? "rotate-90" : "rotate-0"
                             }`}
                         />
                     </>
@@ -138,26 +122,22 @@ export const ReasoningTrigger = memo(
     }
 );
 
-export const ReasoningContent = memo(
-    ({ className, children }: { className?: string; children: string }) => {
-        const { isOpen } = useReasoning();
-
-        if (!isOpen) return null;
-
-        return (
-            <div
-                className={`mt-4 text-sm transition-all duration-200 ease-in-out ${
-                    isOpen ? 'animate-in slide-in-from-top-2' : 'animate-out slide-out-to-top-2'
-                } text-popover-foreground outline-none ${className || ''}`}
-            >
-                <Streamdown className="grid gap-2 [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">
-                    {children}
-                </Streamdown>
-            </div>
-        );
-    }
-);
-
-Reasoning.displayName = 'Reasoning';
-ReasoningTrigger.displayName = 'ReasoningTrigger';
-ReasoningContent.displayName = 'ReasoningContent';
\ No newline at end of file
+export const ReasoningContent = memo(({ className, children }: { className?: string; children: string }) => {
+    const { isOpen } = useReasoning();
+
+    if (!isOpen) return null;
+
+    return (
+        <div
+            className={`mt-4 text-sm transition-all duration-200 ease-in-out ${
+                isOpen ? "animate-in slide-in-from-top-2" : "animate-out slide-out-to-top-2"
+            } text-popover-foreground outline-none ${className || ""}`}
+        >
+            <Streamdown className="grid gap-2 [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">{children}</Streamdown>
+        </div>
+    );
+});
+
+Reasoning.displayName = "Reasoning";
+ReasoningTrigger.displayName = "ReasoningTrigger";
+ReasoningContent.displayName = "ReasoningContent";
diff --git a/frontend/app/view/waveai/waveaiusechat.tsx b/frontend/app/view/waveai/waveaiusechat.tsx
index 148b9a2795..1b334e7a03 100644
--- a/frontend/app/view/waveai/waveaiusechat.tsx
+++ b/frontend/app/view/waveai/waveaiusechat.tsx
@@ -2,7 +2,6 @@
 // SPDX-License-Identifier: Apache-2.0
 
 import { Button } from "@/app/element/button";
-import { Streamdown } from "streamdown";
 import { TypingIndicator } from "@/app/element/typingindicator";
 import { atoms, fetchWaveFile, WOS } from "@/store/global";
 import { BlockService, ObjectService } from "@/store/services";
@@ -14,6 +13,7 @@ import { DefaultChatTransport } from "ai";
 import { atom, Atom, useAtomValue } from "jotai";
 import { OverlayScrollbarsComponent, OverlayScrollbarsComponentRef } from "overlayscrollbars-react";
 import React, { forwardRef, memo, useCallback, useEffect, useImperativeHandle, useMemo, useRef, useState } from "react";
+import { Streamdown } from "streamdown";
 import { debounce, throttle } from "throttle-debounce";
 import { Reasoning, ReasoningContent, ReasoningTrigger } from "./reasoning";
 
@@ -321,9 +321,10 @@ const ChatWindow = memo(
                     <div className="flex flex-col gap-4 p-4">
                         {messages.map((message, index) => {
                             // Only the last assistant message should be streaming when isLoading is true
-                            const isLastAssistantMessage = message.role === "assistant" && index === messages.length - 1;
+                            const isLastAssistantMessage =
+                                message.role === "assistant" && index === messages.length - 1;
                             const isCurrentlyStreaming = isLoading && isLastAssistantMessage;
-                            
+
                             return (
                                 <ChatItem
                                     key={message.id}
@@ -334,14 +335,6 @@ const ChatWindow = memo(
                                 />
                             );
                         })}
-                        {isLoading && (
-                            <div className="flex items-start gap-3">
-                                <div className="flex-shrink-0 w-8 h-8 bg-accent/10 rounded-md flex items-center justify-center">
-                                    <i className="fa-sharp fa-solid fa-sparkles text-accent"></i>
-                                </div>
-                                <TypingIndicator className="mt-1" />
-                            </div>
-                        )}
                         {error && (
                             <div className="flex items-start gap-3">
                                 <div className="flex-shrink-0 w-8 h-8 bg-red-100 rounded-md flex items-center justify-center">
@@ -363,7 +356,12 @@ const ChatWindow = memo(
 ChatWindow.displayName = "ChatWindow";
 
 const ChatItem = memo(
-    ({ message, fontSize, fixedFontSize, isStreaming = false }: {
+    ({
+        message,
+        fontSize,
+        fixedFontSize,
+        isStreaming = false,
+    }: {
         message: ChatMessage;
         fontSize?: string;
         fixedFontSize?: string;
@@ -393,18 +391,24 @@ const ChatItem = memo(
                         <i className="fa-sharp fa-solid fa-sparkles text-accent"></i>
                     </div>
                     <div className="flex flex-col gap-2 max-w-[85%]">
-                        {(reasoning || isStreaming) && (
-                            <Reasoning isStreaming={isStreaming}>
-                                <ReasoningTrigger />
-                                <ReasoningContent>{reasoning || ""}</ReasoningContent>
-                            </Reasoning>
+                        {reasoning && (
+                            <div className="flex items-center min-h-8">
+                                <Reasoning isStreaming={isStreaming}>
+                                    <ReasoningTrigger />
+                                    <ReasoningContent>{reasoning || ""}</ReasoningContent>
+                                </Reasoning>
+                            </div>
                         )}
-                        {content && (
+                        {content ? (
                             <div className="bg-secondary/10 rounded-lg p-3">
                                 <Streamdown className="size-full [&>*:first-child]:mt-0 [&>*:last-child]:mb-0">
                                     {content}
                                 </Streamdown>
                             </div>
+                        ) : (
+                            <div className="flex items-center min-h-8">
+                                <TypingIndicator />
+                            </div>
                         )}
                     </div>
                 </div>
@@ -545,8 +549,16 @@ const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
             try {
                 const allMessages = [...messages, message];
                 const chatMessages = allMessages.map((m) => {
-                    const text = m.parts?.filter((p: any) => p.type === 'text').map((p: any) => p.text).join('') ?? '';
-                    const reasoning = m.parts?.filter((p: any) => p.type === 'reasoning').map((p: any) => p.text).join('') ?? '';
+                    const text =
+                        m.parts
+                            ?.filter((p: any) => p.type === "text")
+                            .map((p: any) => p.text)
+                            .join("") ?? "";
+                    const reasoning =
+                        m.parts
+                            ?.filter((p: any) => p.type === "reasoning")
+                            .map((p: any) => p.text)
+                            .join("") ?? "";
                     return {
                         id: m.id,
                         role: m.role as "user" | "assistant" | "system",
@@ -564,7 +576,7 @@ const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
         },
     });
 
-    const isLoading = status === "submitted";
+    const isLoading = status === "submitted" || status === "streaming";
 
     const handleInputChange = useCallback((e: React.ChangeEvent<HTMLTextAreaElement>) => {
         setInput(e.target.value);
@@ -609,14 +621,14 @@ const WaveAiUseChat = ({ blockId, model }: WaveAiUseChatProps) => {
             <ChatWindow
                 messages={messages.map((m) => {
                     const text = m.parts
-                        .filter((p: any) => p.type === 'text')
+                        .filter((p: any) => p.type === "text")
                         .map((p: any) => p.text)
-                        .join('');
+                        .join("");
 
                     const reasoning = m.parts
-                        .filter((p: any) => p.type === 'reasoning')
+                        .filter((p: any) => p.type === "reasoning")
                         .map((p: any) => p.text)
-                        .join('');
+                        .join("");
 
                     return {
                         id: m.id,