Harden job manager start payload serialization

cursoragent · shrisukhani · cursoragent · commit d95496236743 · 2026-02-14T05:56:33.000Z
Co-authored-by: Shri Sukhani &lt;shrisukhani@users.noreply.github.com&gt;
diff --git a/hyperbrowser/client/managers/async_manager/crawl.py b/hyperbrowser/client/managers/async_manager/crawl.py
@@ -1,5 +1,6 @@
 from typing import Optional
 
+from hyperbrowser.exceptions import HyperbrowserError
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from ...polling import (
     build_fetch_operation_name,
@@ -24,9 +25,20 @@ def __init__(self, client):
         self._client = client
 
     async def start(self, params: StartCrawlJobParams) -> StartCrawlJobResponse:
+        try:
+            payload = params.model_dump(exclude_none=True, by_alias=True)
+        except HyperbrowserError:
+            raise
+        except Exception as exc:
+            raise HyperbrowserError(
+                "Failed to serialize crawl start params",
+                original_error=exc,
+            ) from exc
+        if type(payload) is not dict:
+            raise HyperbrowserError("Failed to serialize crawl start params")
         response = await self._client.transport.post(
             self._client._build_url("/crawl"),
-            data=params.model_dump(exclude_none=True, by_alias=True),
+            data=payload,
         )
         return parse_response_model(
             response.data,
diff --git a/hyperbrowser/client/managers/async_manager/extract.py b/hyperbrowser/client/managers/async_manager/extract.py
@@ -25,7 +25,17 @@ async def start(self, params: StartExtractJobParams) -> StartExtractJobResponse:
         if not params.schema_ and not params.prompt:
             raise HyperbrowserError("Either schema or prompt must be provided")
 
-        payload = params.model_dump(exclude_none=True, by_alias=True)
+        try:
+            payload = params.model_dump(exclude_none=True, by_alias=True)
+        except HyperbrowserError:
+            raise
+        except Exception as exc:
+            raise HyperbrowserError(
+                "Failed to serialize extract start params",
+                original_error=exc,
+            ) from exc
+        if type(payload) is not dict:
+            raise HyperbrowserError("Failed to serialize extract start params")
         if params.schema_:
             payload["schema"] = resolve_schema_input(params.schema_)
 
diff --git a/hyperbrowser/client/managers/async_manager/scrape.py b/hyperbrowser/client/managers/async_manager/scrape.py
@@ -1,5 +1,6 @@
 from typing import Optional
 
+from hyperbrowser.exceptions import HyperbrowserError
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from ...polling import (
     build_fetch_operation_name,
@@ -31,9 +32,20 @@ def __init__(self, client):
     async def start(
         self, params: StartBatchScrapeJobParams
     ) -> StartBatchScrapeJobResponse:
+        try:
+            payload = params.model_dump(exclude_none=True, by_alias=True)
+        except HyperbrowserError:
+            raise
+        except Exception as exc:
+            raise HyperbrowserError(
+                "Failed to serialize batch scrape start params",
+                original_error=exc,
+            ) from exc
+        if type(payload) is not dict:
+            raise HyperbrowserError("Failed to serialize batch scrape start params")
         response = await self._client.transport.post(
             self._client._build_url("/scrape/batch"),
-            data=params.model_dump(exclude_none=True, by_alias=True),
+            data=payload,
         )
         return parse_response_model(
             response.data,
@@ -143,9 +155,20 @@ def __init__(self, client):
         self.batch = BatchScrapeManager(client)
 
     async def start(self, params: StartScrapeJobParams) -> StartScrapeJobResponse:
+        try:
+            payload = params.model_dump(exclude_none=True, by_alias=True)
+        except HyperbrowserError:
+            raise
+        except Exception as exc:
+            raise HyperbrowserError(
+                "Failed to serialize scrape start params",
+                original_error=exc,
+            ) from exc
+        if type(payload) is not dict:
+            raise HyperbrowserError("Failed to serialize scrape start params")
         response = await self._client.transport.post(
             self._client._build_url("/scrape"),
-            data=params.model_dump(exclude_none=True, by_alias=True),
+            data=payload,
         )
         return parse_response_model(
             response.data,
diff --git a/hyperbrowser/client/managers/sync_manager/crawl.py b/hyperbrowser/client/managers/sync_manager/crawl.py
@@ -1,5 +1,6 @@
 from typing import Optional
 
+from hyperbrowser.exceptions import HyperbrowserError
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from ...polling import (
     build_fetch_operation_name,
@@ -24,9 +25,20 @@ def __init__(self, client):
         self._client = client
 
     def start(self, params: StartCrawlJobParams) -> StartCrawlJobResponse:
+        try:
+            payload = params.model_dump(exclude_none=True, by_alias=True)
+        except HyperbrowserError:
+            raise
+        except Exception as exc:
+            raise HyperbrowserError(
+                "Failed to serialize crawl start params",
+                original_error=exc,
+            ) from exc
+        if type(payload) is not dict:
+            raise HyperbrowserError("Failed to serialize crawl start params")
         response = self._client.transport.post(
             self._client._build_url("/crawl"),
-            data=params.model_dump(exclude_none=True, by_alias=True),
+            data=payload,
         )
         return parse_response_model(
             response.data,
diff --git a/hyperbrowser/client/managers/sync_manager/extract.py b/hyperbrowser/client/managers/sync_manager/extract.py
@@ -21,7 +21,17 @@ def start(self, params: StartExtractJobParams) -> StartExtractJobResponse:
         if not params.schema_ and not params.prompt:
             raise HyperbrowserError("Either schema or prompt must be provided")
 
-        payload = params.model_dump(exclude_none=True, by_alias=True)
+        try:
+            payload = params.model_dump(exclude_none=True, by_alias=True)
+        except HyperbrowserError:
+            raise
+        except Exception as exc:
+            raise HyperbrowserError(
+                "Failed to serialize extract start params",
+                original_error=exc,
+            ) from exc
+        if type(payload) is not dict:
+            raise HyperbrowserError("Failed to serialize extract start params")
         if params.schema_:
             payload["schema"] = resolve_schema_input(params.schema_)
 
diff --git a/hyperbrowser/client/managers/sync_manager/scrape.py b/hyperbrowser/client/managers/sync_manager/scrape.py
@@ -1,5 +1,6 @@
 from typing import Optional
 
+from hyperbrowser.exceptions import HyperbrowserError
 from hyperbrowser.models.consts import POLLING_ATTEMPTS
 from ...polling import (
     build_fetch_operation_name,
@@ -29,9 +30,20 @@ def __init__(self, client):
         self._client = client
 
     def start(self, params: StartBatchScrapeJobParams) -> StartBatchScrapeJobResponse:
+        try:
+            payload = params.model_dump(exclude_none=True, by_alias=True)
+        except HyperbrowserError:
+            raise
+        except Exception as exc:
+            raise HyperbrowserError(
+                "Failed to serialize batch scrape start params",
+                original_error=exc,
+            ) from exc
+        if type(payload) is not dict:
+            raise HyperbrowserError("Failed to serialize batch scrape start params")
         response = self._client.transport.post(
             self._client._build_url("/scrape/batch"),
-            data=params.model_dump(exclude_none=True, by_alias=True),
+            data=payload,
         )
         return parse_response_model(
             response.data,
@@ -141,9 +153,20 @@ def __init__(self, client):
         self.batch = BatchScrapeManager(client)
 
     def start(self, params: StartScrapeJobParams) -> StartScrapeJobResponse:
+        try:
+            payload = params.model_dump(exclude_none=True, by_alias=True)
+        except HyperbrowserError:
+            raise
+        except Exception as exc:
+            raise HyperbrowserError(
+                "Failed to serialize scrape start params",
+                original_error=exc,
+            ) from exc
+        if type(payload) is not dict:
+            raise HyperbrowserError("Failed to serialize scrape start params")
         response = self._client.transport.post(
             self._client._build_url("/scrape"),
-            data=params.model_dump(exclude_none=True, by_alias=True),
+            data=payload,
         )
         return parse_response_model(
             response.data,
diff --git a/tests/test_job_manager_serialization.py b/tests/test_job_manager_serialization.py