GrayCodeAI
diff --git a/‎client/bedrock.go‎
Lines changed: 1 addition & 1 deletion b/‎client/bedrock.go‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎client/benchmarks_test.go‎
Lines changed: 293 additions & 0 deletions b/‎client/benchmarks_test.go‎
Lines changed: 293 additions & 0 deletions
diff --git a/‎client/cost_estimator.go‎
Lines changed: 21 additions & 16 deletions b/‎client/cost_estimator.go‎
Lines changed: 21 additions & 16 deletions
diff --git a/‎client/cost_estimator_test.go‎
Lines changed: 3 additions & 1 deletion b/‎client/cost_estimator_test.go‎
Lines changed: 3 additions & 1 deletion
@@ -168,7 +168,7 @@ func (c *BedrockClient) StreamChat(ctx context.Context, messages []EyrieMessage,
 					var args map[string]interface{}
 					_ = json.Unmarshal(chunk.ContentBlock.Input, &args)
 					tc := ToolCall{ID: chunk.ContentBlock.ID, Name: chunk.ContentBlock.Name, Arguments: args}
-					toolCalls = append(toolCalls, tc)
+					_ = append(toolCalls, tc) // individual calls sent via channel; accumulation unused
 					select {
 					case ch <- EyrieStreamEvent{Type: "tool_call", ToolCall: &tc}:
 					case <-streamCtx.Done():
 
@@ -0,0 +1,293 @@
+package client
+
+import (
+	"context"
+	"testing"
+)
+
+// ---------- buildRequestBase ----------
+
+func BenchmarkBuildRequestBase_SimpleMessages(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "system", Content: "You are helpful."},
+		{Role: "user", Content: "Hello"},
+		{Role: "assistant", Content: "Hi there!"},
+		{Role: "user", Content: "How are you?"},
+	}
+	opts := ChatOptions{
+		Model:       "gpt-4",
+		Temperature: floatPtr(0.7),
+		MaxTokens:   4096,
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = buildRequestBase(messages, opts, false, nil)
+	}
+}
+
+func BenchmarkBuildRequestBase_WithToolUse(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "system", Content: "You are helpful."},
+		{Role: "user", Content: "Search for files"},
+		{Role: "assistant", ToolUse: []ToolCall{
+			{ID: "tc-1", Name: "search", Arguments: map[string]interface{}{"query": "main.go"}},
+			{ID: "tc-2", Name: "read", Arguments: map[string]interface{}{"path": "main.go"}},
+		}},
+		{Role: "user", ToolResult: &ToolResult{ToolUseID: "tc-1", Content: "Found 1 file"}},
+		{Role: "user", ToolResult: &ToolResult{ToolUseID: "tc-2", Content: "package main\nfunc main() {}"}},
+	}
+	opts := ChatOptions{
+		Model: "gpt-4",
+		Tools: []EyrieTool{
+			{Name: "search", Description: "Search for files", Parameters: map[string]interface{}{"query": map[string]string{"type": "string"}}},
+			{Name: "read", Description: "Read a file", Parameters: map[string]interface{}{"path": map[string]string{"type": "string"}}},
+		},
+		MaxTokens: 4096,
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = buildRequestBase(messages, opts, false, nil)
+	}
+}
+
+func BenchmarkBuildRequestBase_WithImages(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "user", Content: "What's in this image?", Images: []string{"data:image/png;base64,iVBORw0KGgo="}},
+	}
+	opts := ChatOptions{Model: "gpt-4-vision", MaxTokens: 4096}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = buildRequestBase(messages, opts, false, nil)
+	}
+}
+
+func BenchmarkBuildRequestBase_Streaming(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "user", Content: "Write a long essay"},
+	}
+	opts := ChatOptions{Model: "gpt-4", MaxTokens: 4096}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = buildRequestBase(messages, opts, true, nil)
+	}
+}
+
+// ---------- buildCacheKey ----------
+
+func BenchmarkBuildCacheKey_Short(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "user", Content: "Hello"},
+	}
+	opts := ChatOptions{Model: "gpt-4"}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = buildCacheKey(messages, opts)
+	}
+}
+
+func BenchmarkBuildCacheKey_Long(b *testing.B) {
+	longContent := make([]byte, 4000)
+	for i := range longContent {
+		longContent[i] = 'a'
+	}
+	messages := []EyrieMessage{
+		{Role: "system", Content: string(longContent)},
+		{Role: "user", Content: "Hello"},
+		{Role: "assistant", Content: string(longContent)},
+		{Role: "user", Content: "Continue"},
+	}
+	opts := ChatOptions{Model: "gpt-4", System: "You are helpful"}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = buildCacheKey(messages, opts)
+	}
+}
+
+func BenchmarkBuildCacheKey_WithToolCalls(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "assistant", ToolUse: []ToolCall{
+			{ID: "tc-1", Name: "search", Arguments: map[string]interface{}{"query": "test"}},
+		}},
+		{Role: "user", ToolResult: &ToolResult{ToolUseID: "tc-1", Content: "result"}},
+	}
+	opts := ChatOptions{Model: "gpt-4"}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = buildCacheKey(messages, opts)
+	}
+}
+
+// ---------- CachedProvider ----------
+
+func BenchmarkCachedProvider_CacheHit(b *testing.B) {
+	mock := NewMockProvider(MockModeFixed)
+	mock.Response = "cached response"
+	cp := NewCachedProvider(mock, DefaultCacheConfig())
+	messages := []EyrieMessage{{Role: "user", Content: "Hello"}}
+	opts := ChatOptions{Model: "gpt-4"}
+
+	// Prime the cache
+	_, _ = cp.Chat(context.TODO(), messages, opts)
+
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_, _ = cp.Chat(context.TODO(), messages, opts)
+	}
+}
+
+func BenchmarkCachedProvider_CacheMiss(b *testing.B) {
+	mock := NewMockProvider(MockModeFixed)
+	mock.Response = "response"
+	cp := NewCachedProvider(mock, DefaultCacheConfig())
+	opts := ChatOptions{Model: "gpt-4"}
+
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		messages := []EyrieMessage{{Role: "user", Content: "unique query"}}
+		_, _ = cp.Chat(context.TODO(), messages, opts)
+	}
+}
+
+// ---------- SanitizeMessages ----------
+
+func BenchmarkSanitizeMessages_Clean(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "user", Content: "Hello"},
+		{Role: "assistant", Content: "Hi there!"},
+		{Role: "user", Content: "How are you?"},
+		{Role: "assistant", Content: "I'm good."},
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = SanitizeMessages(messages)
+	}
+}
+
+func BenchmarkSanitizeMessages_WithOrphans(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "user", Content: "Search for files"},
+		{Role: "assistant", ToolUse: []ToolCall{
+			{ID: "tc-1", Name: "search", Arguments: map[string]interface{}{"query": "test"}},
+			{ID: "tc-2", Name: "read", Arguments: map[string]interface{}{"path": "main.go"}},
+		}},
+		// tc-1 has result, tc-2 is orphaned
+		{Role: "user", ToolResult: &ToolResult{ToolUseID: "tc-1", Content: "Found 1 file"}},
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = SanitizeMessages(messages)
+	}
+}
+
+func BenchmarkSanitizeMessages_Large(b *testing.B) {
+	messages := make([]EyrieMessage, 50)
+	for i := range messages {
+		if i%3 == 0 {
+			messages[i] = EyrieMessage{Role: "user", Content: "message"}
+		} else {
+			messages[i] = EyrieMessage{Role: "assistant", Content: "response"}
+		}
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = SanitizeMessages(messages)
+	}
+}
+
+// ---------- MergeConsecutiveRoles ----------
+
+func BenchmarkMergeConsecutiveRoles_NoMerge(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "user", Content: "Hello"},
+		{Role: "assistant", Content: "Hi"},
+		{Role: "user", Content: "How are you?"},
+		{Role: "assistant", Content: "Good"},
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = MergeConsecutiveRoles(messages)
+	}
+}
+
+func BenchmarkMergeConsecutiveRoles_WithMerges(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "user", Content: "Hello"},
+		{Role: "user", Content: "World"},
+		{Role: "assistant", Content: "Hi"},
+		{Role: "assistant", Content: "There"},
+		{Role: "user", Content: "How are you?"},
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = MergeConsecutiveRoles(messages)
+	}
+}
+
+func BenchmarkMergeConsecutiveRoles_WithToolUse(b *testing.B) {
+	messages := []EyrieMessage{
+		{Role: "assistant", ToolUse: []ToolCall{{ID: "tc-1", Name: "search"}}},
+		{Role: "assistant", Content: "Let me search"},
+		{Role: "user", ToolResult: &ToolResult{ToolUseID: "tc-1", Content: "result"}},
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = MergeConsecutiveRoles(messages)
+	}
+}
+
+// ---------- MetricsCollector ----------
+
+func BenchmarkMetricsCollector_Record(b *testing.B) {
+	mc := NewMetricsCollector()
+	m := CallMetrics{Model: "gpt-4", Provider: "openai", InputTokens: 100, OutputTokens: 50, LatencyMs: 100}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		mc.Record(m)
+	}
+}
+
+func BenchmarkMetricsCollector_Recent(b *testing.B) {
+	mc := NewMetricsCollector()
+	m := CallMetrics{Model: "gpt-4", Provider: "openai", InputTokens: 100, OutputTokens: 50, LatencyMs: 100}
+	for i := 0; i < 100; i++ {
+		mc.Record(m)
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = mc.Recent(10)
+	}
+}
+
+func BenchmarkMetricsCollector_TotalCost(b *testing.B) {
+	mc := NewMetricsCollector()
+	m := CallMetrics{Model: "gpt-4", Provider: "openai", InputTokens: 1000, OutputTokens: 500, CacheReadTokens: 200, CacheCreationTokens: 100}
+	for i := 0; i < 100; i++ {
+		mc.Record(m)
+	}
+	b.ReportAllocs()
+	b.ResetTimer()
+	for i := 0; i < b.N; i++ {
+		_ = mc.TotalCost()
+	}
+}
+
+// ---------- helpers ----------
+
+func floatPtr(f float64) *float64 { return &f }
@@ -4,6 +4,8 @@ import (
 	"fmt"
 	"strings"
 	"sync"
+
+	"github.com/GrayCodeAI/tok"
 )
 
 // CostEstimator estimates the cost of an API call BEFORE sending it.
@@ -63,15 +65,14 @@ func (ce *CostEstimator) IsExpensive(est CostEstimate, threshold float64) bool {
 func (ce *CostEstimator) countInputTokens(messages []EyrieMessage) int {
 	total := 0
 	for _, m := range messages {
-		// ~4 chars per token (rough estimate for fast pre-call estimation)
-		total += len(m.Content) / 4
+		total += tok.EstimateTokens(m.Content)
 		if m.ToolResult != nil {
-			total += len(m.ToolResult.Content) / 4
+			total += tok.EstimateTokens(m.ToolResult.Content)
 		}
 		for _, tc := range m.ToolUse {
 			total += 50 // tool call overhead
 			for _, v := range tc.Arguments {
-				total += len(fmt.Sprintf("%v", v)) / 4
+				total += tok.EstimateTokens(fmt.Sprintf("%v", v))
 			}
 		}
 	}
@@ -99,7 +100,7 @@ func NewStreamingTokenCounter(model string, inputTokens int) *StreamingTokenCoun
 // AddOutput records streamed output tokens.
 func (stc *StreamingTokenCounter) AddOutput(text string) {
 	stc.mu.Lock()
-	stc.outputTokens += len(text) / 4
+	stc.outputTokens += tok.EstimateTokens(text)
 	stc.mu.Unlock()
 }
 
@@ -156,7 +157,7 @@ func NewPromptOptimizer(maxInputTokens int) *PromptOptimizer {
 func (po *PromptOptimizer) Optimize(messages []EyrieMessage) []EyrieMessage {
 	totalTokens := 0
 	for _, m := range messages {
-		totalTokens += len(m.Content)/4 + 10 // +10 for overhead
+		totalTokens += tok.EstimateTokens(m.Content) + 10 // +10 for overhead
 	}
 
 	if totalTokens <= po.maxInputTokens {
@@ -190,17 +191,21 @@ func (po *PromptOptimizer) Optimize(messages []EyrieMessage) []EyrieMessage {
 func compressMessages(messages []EyrieMessage) string {
 	var parts []string
 	for _, m := range messages {
-		content := m.Content
-		if len(content) > 100 {
-			content = content[:100] + "..."
-		}
-		if content != "" {
-			parts = append(parts, m.Role+": "+content)
+		if m.Content != "" {
+			parts = append(parts, m.Role+": "+m.Content)
 		}
 	}
-	summary := strings.Join(parts, " | ")
-	if len(summary) > 500 {
-		summary = summary[:500]
+	raw := strings.Join(parts, "\n")
+
+	// Use tok compression pipeline for intelligent summarization
+	compressed, _ := tok.Compress(raw, tok.Minimal)
+	if len(compressed) > 0 && len(compressed) < len(raw) {
+		return compressed
+	}
+
+	// Fallback: naive truncation
+	if len(raw) > 500 {
+		raw = raw[:500]
 	}
-	return summary
+	return raw
 }
@@ -3,6 +3,8 @@ package client
 import (
 	"math"
 	"testing"
+
+	"github.com/GrayCodeAI/tok"
 )
 
 func TestCostEstimateForKnownModels(t *testing.T) {
@@ -71,7 +73,7 @@ func TestCostEstimateUnknownModelReturnsNonZero(t *testing.T) {
 	expectedInPrice := 1.0 / 1_000_000
 	expectedOutPrice := 3.0 / 1_000_000
 
-	inputTokens := len("test message here") / 4
+	inputTokens := tok.EstimateTokens("test message here")
 	expectedInput := float64(inputTokens) * expectedInPrice
 	expectedOutput := float64(1000) * expectedOutPrice