SentienceAPI
diff --git a/‎screenshot.png‎
-3.84 KB b/‎screenshot.png‎
-3.84 KB
diff --git a/‎sentience/agent_runtime.py‎
Lines changed: 140 additions & 31 deletions b/‎sentience/agent_runtime.py‎
Lines changed: 140 additions & 31 deletions
diff --git a/‎sentience/backends/cdp_backend.py‎
Lines changed: 5 additions & 0 deletions b/‎sentience/backends/cdp_backend.py‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎sentience/backends/playwright_backend.py‎
Lines changed: 4 additions & 0 deletions b/‎sentience/backends/playwright_backend.py‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎sentience/backends/protocol_v0.py‎
Lines changed: 9 additions & 0 deletions b/‎sentience/backends/protocol_v0.py‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎sentience/extension/background.js‎
Lines changed: 3 additions & 3 deletions b/‎sentience/extension/background.js‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎sentience/extension/content.js‎
Lines changed: 6 additions & 6 deletions b/‎sentience/extension/content.js‎
Lines changed: 6 additions & 6 deletions
@@ -2,51 +2,78 @@
 Agent runtime for verification loop support.
 
 This module provides a thin runtime wrapper that combines:
-1. Browser session management
+1. Browser session management (via BrowserBackendV0 protocol)
 2. Snapshot/query helpers
 3. Tracer for event emission
 4. Assertion/verification methods
 
 The AgentRuntime is designed to be used in agent verification loops where
 you need to repeatedly take snapshots, execute actions, and verify results.
 
-Example usage:
-    from sentience import AsyncSentienceBrowser
+Example usage with browser-use:
+    from browser_use import BrowserSession, BrowserProfile
+    from sentience import get_extension_dir
+    from sentience.backends import BrowserUseAdapter
     from sentience.agent_runtime import AgentRuntime
     from sentience.verification import url_matches, exists
     from sentience.tracing import Tracer, JsonlTraceSink
 
+    # Setup browser-use with Sentience extension
+    profile = BrowserProfile(args=[f"--load-extension={get_extension_dir()}"])
+    session = BrowserSession(browser_profile=profile)
+    await session.start()
+
+    # Create adapter and backend
+    adapter = BrowserUseAdapter(session)
+    backend = await adapter.create_backend()
+
+    # Navigate using browser-use
+    page = await session.get_current_page()
+    await page.goto("https://example.com")
+
+    # Create runtime with backend
+    sink = JsonlTraceSink("trace.jsonl")
+    tracer = Tracer(run_id="test-run", sink=sink)
+    runtime = AgentRuntime(backend=backend, tracer=tracer)
+
+    # Take snapshot and run assertions
+    await runtime.snapshot()
+    runtime.assert_(url_matches(r"example\\.com"), label="on_homepage")
+    runtime.assert_(exists("role=button"), label="has_buttons")
+
+    # Check if task is done
+    if runtime.assert_done(exists("text~'Success'"), label="task_complete"):
+        print("Task completed!")
+
+Example usage with AsyncSentienceBrowser (backward compatible):
+    from sentience import AsyncSentienceBrowser
+    from sentience.agent_runtime import AgentRuntime
+
     async with AsyncSentienceBrowser() as browser:
         page = await browser.new_page()
         await page.goto("https://example.com")
 
-        sink = JsonlTraceSink("trace.jsonl")
-        tracer = Tracer(run_id="test-run", sink=sink)
-
-        runtime = AgentRuntime(browser=browser, page=page, tracer=tracer)
-
-        # Take snapshot and run assertions
+        runtime = await AgentRuntime.from_sentience_browser(
+            browser=browser,
+            page=page,
+            tracer=tracer,
+        )
         await runtime.snapshot()
-        runtime.assert_(url_matches(r"example\\.com"), label="on_homepage")
-        runtime.assert_(exists("role=button"), label="has_buttons")
-
-        # Check if task is done
-        if runtime.assert_done(exists("text~'Success'"), label="task_complete"):
-            print("Task completed!")
 """
 
 from __future__ import annotations
 
 import uuid
 from typing import TYPE_CHECKING, Any
 
-from .verification import AssertContext, AssertOutcome, Predicate
+from .models import Snapshot, SnapshotOptions
+from .verification import AssertContext, Predicate
 
 if TYPE_CHECKING:
     from playwright.async_api import Page
 
+    from .backends.protocol_v0 import BrowserBackendV0
     from .browser import AsyncSentienceBrowser
-    from .models import Snapshot
     from .tracing import Tracer
 
 
@@ -63,8 +90,7 @@ class AgentRuntime:
     to the tracer for Studio timeline display.
 
     Attributes:
-        browser: AsyncSentienceBrowser instance
-        page: Playwright Page instance
+        backend: BrowserBackendV0 instance for browser operations
         tracer: Tracer for event emission
         step_id: Current step identifier
         step_index: Current step index (0-based)
@@ -73,36 +99,90 @@ class AgentRuntime:
 
     def __init__(
         self,
-        browser: AsyncSentienceBrowser,
-        page: Page,
+        backend: BrowserBackendV0,
         tracer: Tracer,
+        snapshot_options: SnapshotOptions | None = None,
+        sentience_api_key: str | None = None,
     ):
         """
-        Initialize agent runtime.
+        Initialize agent runtime with any BrowserBackendV0-compatible browser.
 
         Args:
-            browser: AsyncSentienceBrowser instance for taking snapshots
-            page: Playwright Page for browser interaction
+            backend: Any browser implementing BrowserBackendV0 protocol.
+                     Examples:
+                     - CDPBackendV0 (for browser-use via BrowserUseAdapter)
+                     - PlaywrightBackend (future, for direct Playwright)
             tracer: Tracer for emitting verification events
+            snapshot_options: Default options for snapshots
+            sentience_api_key: API key for Pro/Enterprise tier (enables Gateway refinement)
         """
-        self.browser = browser
-        self.page = page
+        self.backend = backend
         self.tracer = tracer
 
+        # Build default snapshot options with API key if provided
+        default_opts = snapshot_options or SnapshotOptions()
+        if sentience_api_key:
+            default_opts.sentience_api_key = sentience_api_key
+            if default_opts.use_api is None:
+                default_opts.use_api = True
+        self._snapshot_options = default_opts
+
         # Step tracking
         self.step_id: str | None = None
         self.step_index: int = 0
 
         # Snapshot state
         self.last_snapshot: Snapshot | None = None
 
+        # Cached URL (updated on snapshot or explicit get_url call)
+        self._cached_url: str | None = None
+
         # Assertions accumulated during current step
         self._assertions_this_step: list[dict[str, Any]] = []
 
         # Task completion tracking
         self._task_done: bool = False
         self._task_done_label: str | None = None
 
+    @classmethod
+    async def from_sentience_browser(
+        cls,
+        browser: AsyncSentienceBrowser,
+        page: Page,
+        tracer: Tracer,
+        snapshot_options: SnapshotOptions | None = None,
+        sentience_api_key: str | None = None,
+    ) -> AgentRuntime:
+        """
+        Create AgentRuntime from AsyncSentienceBrowser (backward compatibility).
+
+        This factory method wraps an AsyncSentienceBrowser + Page combination
+        into the new BrowserBackendV0-based AgentRuntime.
+
+        Args:
+            browser: AsyncSentienceBrowser instance
+            page: Playwright Page for browser interaction
+            tracer: Tracer for emitting verification events
+            snapshot_options: Default options for snapshots
+            sentience_api_key: API key for Pro/Enterprise tier
+
+        Returns:
+            AgentRuntime instance
+        """
+        from .backends.playwright_backend import PlaywrightBackend
+
+        backend = PlaywrightBackend(page)
+        runtime = cls(
+            backend=backend,
+            tracer=tracer,
+            snapshot_options=snapshot_options,
+            sentience_api_key=sentience_api_key,
+        )
+        # Store browser reference for snapshot() to use
+        runtime._legacy_browser = browser
+        runtime._legacy_page = page
+        return runtime
+
     def _ctx(self) -> AssertContext:
         """
         Build assertion context from current state.
@@ -113,28 +193,57 @@ def _ctx(self) -> AssertContext:
         url = None
         if self.last_snapshot is not None:
             url = self.last_snapshot.url
-        elif self.page:
-            url = self.page.url
+        elif self._cached_url:
+            url = self._cached_url
 
         return AssertContext(
             snapshot=self.last_snapshot,
             url=url,
             step_id=self.step_id,
         )
 
-    async def snapshot(self, **kwargs) -> Snapshot:
+    async def get_url(self) -> str:
+        """
+        Get current page URL.
+
+        Returns:
+            Current page URL
+        """
+        url = await self.backend.get_url()
+        self._cached_url = url
+        return url
+
+    async def snapshot(self, **kwargs: Any) -> Snapshot:
         """
         Take a snapshot of the current page state.
 
         This updates last_snapshot which is used as context for assertions.
 
         Args:
-            **kwargs: Passed through to browser.snapshot()
+            **kwargs: Override default snapshot options for this call.
+                     Common options:
+                     - limit: Maximum elements to return
+                     - goal: Task goal for ordinal support
+                     - screenshot: Include screenshot
+                     - show_overlay: Show visual overlay
 
         Returns:
             Snapshot of current page state
         """
-        self.last_snapshot = await self.browser.snapshot(self.page, **kwargs)
+        # Check if using legacy browser (backward compat)
+        if hasattr(self, "_legacy_browser") and hasattr(self, "_legacy_page"):
+            self.last_snapshot = await self._legacy_browser.snapshot(self._legacy_page, **kwargs)
+            return self.last_snapshot
+
+        # Use backend-agnostic snapshot
+        from .backends.snapshot import snapshot as backend_snapshot
+
+        # Merge default options with call-specific kwargs
+        options_dict = self._snapshot_options.model_dump(exclude_none=True)
+        options_dict.update(kwargs)
+        options = SnapshotOptions(**options_dict)
+
+        self.last_snapshot = await backend_snapshot(self.backend, options=options)
         return self.last_snapshot
 
     def begin_step(self, goal: str, step_index: int | None = None) -> str:
 
@@ -386,3 +386,8 @@ async def wait_ready_state(
 
             # Poll every 100ms
             await asyncio.sleep(0.1)
+
+    async def get_url(self) -> str:
+        """Get current page URL."""
+        result = await self.eval("window.location.href")
+        return result if result else ""
@@ -185,6 +185,10 @@ async def wait_ready_state(
 
             await asyncio.sleep(0.1)
 
+    async def get_url(self) -> str:
+        """Get current page URL."""
+        return self._page.url
+
 
 # Verify protocol compliance at import time
 assert isinstance(PlaywrightBackend.__new__(PlaywrightBackend), BrowserBackendV0)
@@ -205,3 +205,12 @@ async def wait_ready_state(
             TimeoutError: If state not reached within timeout
         """
         ...
+
+    async def get_url(self) -> str:
+        """
+        Get current page URL.
+
+        Returns:
+            Current page URL (window.location.href)
+        """
+        ...
@@ -28,14 +28,14 @@ async function handleSnapshotProcessing(rawData, options = {}) {
     const startTime = performance.now();
     try {
         if (!Array.isArray(rawData)) throw new Error("rawData must be an array");
-        if (rawData.length > 1e4 && (rawData = rawData.slice(0, 1e4)), await initWASM(), 
+        if (rawData.length > 1e4 && (rawData = rawData.slice(0, 1e4)), await initWASM(),
         !wasmReady) throw new Error("WASM module not initialized");
         let analyzedElements, prunedRawData;
         try {
             const wasmPromise = new Promise((resolve, reject) => {
                 try {
                     let result;
-                    result = options.limit || options.filter ? analyze_page_with_options(rawData, options) : analyze_page(rawData), 
+                    result = options.limit || options.filter ? analyze_page_with_options(rawData, options) : analyze_page(rawData),
                     resolve(result);
                 } catch (e) {
                     reject(e);
@@ -101,4 +101,4 @@ initWASM().catch(err => {}), chrome.runtime.onMessage.addListener((request, send
     event.preventDefault();
 }), self.addEventListener("unhandledrejection", event => {
     event.preventDefault();
-});
+});
@@ -82,7 +82,7 @@
                 if (!elements || !Array.isArray(elements)) return;
                 removeOverlay();
                 const host = document.createElement("div");
-                host.id = OVERLAY_HOST_ID, host.style.cssText = "\n        position: fixed !important;\n        top: 0 !important;\n        left: 0 !important;\n        width: 100vw !important;\n        height: 100vh !important;\n        pointer-events: none !important;\n        z-index: 2147483647 !important;\n        margin: 0 !important;\n        padding: 0 !important;\n    ", 
+                host.id = OVERLAY_HOST_ID, host.style.cssText = "\n        position: fixed !important;\n        top: 0 !important;\n        left: 0 !important;\n        width: 100vw !important;\n        height: 100vh !important;\n        pointer-events: none !important;\n        z-index: 2147483647 !important;\n        margin: 0 !important;\n        padding: 0 !important;\n    ",
                 document.body.appendChild(host);
                 const shadow = host.attachShadow({
                     mode: "closed"
@@ -94,15 +94,15 @@
                     let color;
                     color = isTarget ? "#FF0000" : isPrimary ? "#0066FF" : "#00FF00";
                     const importanceRatio = maxImportance > 0 ? importance / maxImportance : .5, borderOpacity = isTarget ? 1 : isPrimary ? .9 : Math.max(.4, .5 + .5 * importanceRatio), fillOpacity = .2 * borderOpacity, borderWidth = isTarget ? 2 : isPrimary ? 1.5 : Math.max(.5, Math.round(2 * importanceRatio)), hexOpacity = Math.round(255 * fillOpacity).toString(16).padStart(2, "0"), box = document.createElement("div");
-                    if (box.style.cssText = `\n            position: absolute;\n            left: ${bbox.x}px;\n            top: ${bbox.y}px;\n            width: ${bbox.width}px;\n            height: ${bbox.height}px;\n            border: ${borderWidth}px solid ${color};\n            background-color: ${color}${hexOpacity};\n            box-sizing: border-box;\n            opacity: ${borderOpacity};\n            pointer-events: none;\n        `, 
+                    if (box.style.cssText = `\n            position: absolute;\n            left: ${bbox.x}px;\n            top: ${bbox.y}px;\n            width: ${bbox.width}px;\n            height: ${bbox.height}px;\n            border: ${borderWidth}px solid ${color};\n            background-color: ${color}${hexOpacity};\n            box-sizing: border-box;\n            opacity: ${borderOpacity};\n            pointer-events: none;\n        `,
                     importance > 0 || isPrimary) {
                         const badge = document.createElement("span");
-                        badge.textContent = isPrimary ? `⭐${importance}` : `${importance}`, badge.style.cssText = `\n                position: absolute;\n                top: -18px;\n                left: 0;\n                background: ${color};\n                color: white;\n                font-size: 11px;\n                font-weight: bold;\n                padding: 2px 6px;\n                font-family: Arial, sans-serif;\n                border-radius: 3px;\n                opacity: 0.95;\n                white-space: nowrap;\n                pointer-events: none;\n            `, 
+                        badge.textContent = isPrimary ? `⭐${importance}` : `${importance}`, badge.style.cssText = `\n                position: absolute;\n                top: -18px;\n                left: 0;\n                background: ${color};\n                color: white;\n                font-size: 11px;\n                font-weight: bold;\n                padding: 2px 6px;\n                font-family: Arial, sans-serif;\n                border-radius: 3px;\n                opacity: 0.95;\n                white-space: nowrap;\n                pointer-events: none;\n            `,
                         box.appendChild(badge);
                     }
                     if (isTarget) {
                         const targetIndicator = document.createElement("span");
-                        targetIndicator.textContent = "🎯", targetIndicator.style.cssText = "\n                position: absolute;\n                top: -18px;\n                right: 0;\n                font-size: 16px;\n                pointer-events: none;\n            ", 
+                        targetIndicator.textContent = "🎯", targetIndicator.style.cssText = "\n                position: absolute;\n                top: -18px;\n                right: 0;\n                font-size: 16px;\n                pointer-events: none;\n            ",
                         box.appendChild(targetIndicator);
                     }
                     shadow.appendChild(box);
@@ -120,7 +120,7 @@
     let overlayTimeout = null;
     function removeOverlay() {
         const existing = document.getElementById(OVERLAY_HOST_ID);
-        existing && existing.remove(), overlayTimeout && (clearTimeout(overlayTimeout), 
+        existing && existing.remove(), overlayTimeout && (clearTimeout(overlayTimeout),
         overlayTimeout = null);
     }
-}();
+}();