iiitl · Aaryan-Dadu · Apr 12, 2026 · Apr 11, 2026 · Apr 12, 2026 · coderabbitai
diff --git a/chuck/__main__.py b/chuck/__main__.py
@@ -37,6 +37,12 @@ def main() -> int:
         ],
         help="Run a single capability benchmark",
     )
+    bench_parser.add_argument(
+    "--size",
+    type=int,
+    default=None,
+    help="Override the default benchmark size"
+    )
     subparsers.add_parser("regress", help="Run regression checks")
     subparsers.add_parser("generate-baselines", help="Generate regression baselines")
     snapshot_parser = subparsers.add_parser("snapshot", help="Create a performance/reliability snapshot")
@@ -81,7 +87,7 @@ def main() -> int:
     command = args.command or "bench"
 
     if command == "bench":
-        print(format_benchmarks(run_benchmarks(task=args.task)))
+        print(format_benchmarks(run_benchmarks(task=args.task,size=args.size)))
         return 0
     if command == "regress":
         print(format_regression(run_regression()))

diff --git a/chuck/benchmark.py b/chuck/benchmark.py
@@ -43,12 +43,12 @@
 }
 
 
-def run_benchmarks(task: str | None = None) -> list[dict[str, Any]]:
+def run_benchmarks(task: str | None = None, size: int | None = None) -> list[dict[str, Any]]:
     if task is None:
-        return [runner() for runner in RUNNERS]
-    runner = RUNNER_BY_NAME[task]
-    return [runner()]
+        return [runner(size=size) for runner in RUNNERS]
 
+    runner = RUNNER_BY_NAME[task]
+    return [runner(size=size)]
 
 def _compact_output(output: Any) -> str:
     if not isinstance(output, dict):

diff --git a/chuck/benchmarks/compute_core/__init__.py b/chuck/benchmarks/compute_core/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.compute_core import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_009)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_009,size=size)
diff --git a/chuck/benchmarks/data_encoding/__init__.py b/chuck/benchmarks/data_encoding/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.data_encoding import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_004)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_004,size=size)
diff --git a/chuck/benchmarks/graph_analytics/__init__.py b/chuck/benchmarks/graph_analytics/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.graph_analytics import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_005)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_005,size=size)
diff --git a/chuck/benchmarks/io_pipeline/__init__.py b/chuck/benchmarks/io_pipeline/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.io_pipeline import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_001)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_001, size=size)
diff --git a/chuck/benchmarks/memory_index/__init__.py b/chuck/benchmarks/memory_index/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.memory_index import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_008)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_008,size=size)
diff --git a/chuck/benchmarks/memory_tier/__init__.py b/chuck/benchmarks/memory_tier/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.memory_tier import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_007)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_007,size=size)
diff --git a/chuck/benchmarks/ordering_core/__init__.py b/chuck/benchmarks/ordering_core/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.ordering_core import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_002)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_002,size=size)
diff --git a/chuck/benchmarks/prime_analytics/__init__.py b/chuck/benchmarks/prime_analytics/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.prime_analytics import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_006)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_006,size=size)
diff --git a/chuck/benchmarks/relational_fusion/__init__.py b/chuck/benchmarks/relational_fusion/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.relational_fusion import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_010)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_010,size=size)
diff --git a/chuck/benchmarks/retrieval_core/__init__.py b/chuck/benchmarks/retrieval_core/__init__.py
@@ -6,5 +6,5 @@
 from ...tasks.retrieval_core import TASK_SPEC
 
 
-def run() -> dict[str, Any]:
-    return benchmark_task(TASK_SPEC, seed=1_003)
+def run(size: int | None = None) -> dict[str, Any]:
+    return benchmark_task(TASK_SPEC, seed=1_003,size=size)
diff --git a/chuck/tasks/graph_analytics/task.py b/chuck/tasks/graph_analytics/task.py
@@ -44,4 +44,4 @@ def solve(graph: dict[str, list[str]], iterations: int = 16, damping: float = 0.
     }
 
 
-TASK_SPEC = TaskSpec("graph_analytics", generate, solve, 48, 1_000)
+TASK_SPEC = TaskSpec("graph_analytics", generate, solve, 48, 200_000)
diff --git a/chuck/tasks/retrieval_core/task.py b/chuck/tasks/retrieval_core/task.py
@@ -72,7 +72,7 @@ def solve(payload: dict[str, Any]) -> dict[str, Any]:
     generate,
     solve,
     48,
-    2_000,
+    2000_000,
     algorithm_style="probabilistic",
     reliability_floor=0.88,
 )
Original file line number	Diff line number	Diff line change
Expand Up		@@ -44,4 +44,4 @@ def solve(graph: dict[str, list[str]], iterations: int = 16, damping: float = 0.
		}


		TASK_SPEC = TaskSpec("graph_analytics", generate, solve, 48, 1_000)
		TASK_SPEC = TaskSpec("graph_analytics", generate, solve, 48, 200_000)
Comment thread Aaryan-Dadu marked this conversation as resolved.