feat(platform-cost): add cost percentile and distribution stats to dashboard

Add p50/p75/p95/p99 cost percentiles using PostgreSQL percentile_cont() and histogram bucket distribution to PlatformCostDashboard. Display percentile summary cards and cost bucket grid in the frontend.
2026-04-30 03:00:41 -04:00 · 2026-04-13 00:52:20 +00:00
parent cdd566c9d1
commit 348cdac328
3 changed files with 205 additions and 84 deletions
--- a/autogpt_platform/backend/backend/data/platform_cost.py
+++ b/autogpt_platform/backend/backend/data/platform_cost.py
@@ -8,6 +8,7 @@ from prisma.models import User as PrismaUser
 from prisma.types import PlatformCostLogCreateInput, PlatformCostLogWhereInput
 from pydantic import BaseModel

+from backend.data.db import query_raw_with_schema
 from backend.util.cache import cached
 from backend.util.json import SafeJson

@@ -172,6 +173,11 @@ class PlatformCostDashboard(BaseModel):
    avg_input_tokens_per_request: float = 0.0
    avg_output_tokens_per_request: float = 0.0
    avg_cost_microdollars_per_request: float = 0.0
+    cost_p50_microdollars: float = 0.0
+    cost_p75_microdollars: float = 0.0
+    cost_p95_microdollars: float = 0.0
+    cost_p99_microdollars: float = 0.0
+    cost_buckets: list[dict] = []


 def _si(row: dict, field: str) -> int:
@@ -269,43 +275,88 @@ async def get_platform_cost_dashboard(
        "trackingAmount": True,
    }

-    # Run all four aggregation queries in parallel.
-    by_provider_groups, by_user_groups, total_user_groups, total_agg_groups = (
-        await asyncio.gather(
-            # (provider, trackingType, model) aggregation — no ORDER BY in ORM;
-            # sort by total cost descending in Python after fetch.
-            PrismaLog.prisma().group_by(
-                by=["provider", "trackingType", "model"],
-                where=where,
-                sum=sum_fields,
-                count=True,
-            ),
-            # userId aggregation — emails fetched separately below.
-            PrismaLog.prisma().group_by(
-                by=["userId"],
-                where=where,
-                sum=sum_fields,
-                count=True,
-            ),
-            # Distinct user count: group by userId, count groups.
-            PrismaLog.prisma().group_by(
-                by=["userId"],
-                where=where,
-                count=True,
-            ),
-            # Total aggregate: group by (provider, trackingType) so we can
-            # distinguish cost-bearing rows for per-request averages.
-            PrismaLog.prisma().group_by(
-                by=["provider", "trackingType"],
-                where=where,
-                sum={
-                    "costMicrodollars": True,
-                    "inputTokens": True,
-                    "outputTokens": True,
-                },
-                count=True,
-            ),
-        )
+    # Run all six aggregation queries in parallel.
+    (
+        by_provider_groups,
+        by_user_groups,
+        total_user_groups,
+        total_agg_groups,
+        percentile_rows,
+        bucket_rows,
+    ) = await asyncio.gather(
+        # (provider, trackingType, model) aggregation — no ORDER BY in ORM;
+        # sort by total cost descending in Python after fetch.
+        PrismaLog.prisma().group_by(
+            by=["provider", "trackingType", "model"],
+            where=where,
+            sum=sum_fields,
+            count=True,
+        ),
+        # userId aggregation — emails fetched separately below.
+        PrismaLog.prisma().group_by(
+            by=["userId"],
+            where=where,
+            sum=sum_fields,
+            count=True,
+        ),
+        # Distinct user count: group by userId, count groups.
+        PrismaLog.prisma().group_by(
+            by=["userId"],
+            where=where,
+            count=True,
+        ),
+        # Total aggregate: group by (provider, trackingType) so we can
+        # distinguish cost-bearing rows for per-request averages.
+        PrismaLog.prisma().group_by(
+            by=["provider", "trackingType"],
+            where=where,
+            sum={
+                "costMicrodollars": True,
+                "inputTokens": True,
+                "outputTokens": True,
+            },
+            count=True,
+        ),
+        # Percentile distribution of cost per request.
+        query_raw_with_schema(
+            "SELECT"
+            "  percentile_cont(0.5) WITHIN GROUP"
+            '    (ORDER BY "costMicrodollars") as p50,'
+            "  percentile_cont(0.75) WITHIN GROUP"
+            '    (ORDER BY "costMicrodollars") as p75,'
+            "  percentile_cont(0.95) WITHIN GROUP"
+            '    (ORDER BY "costMicrodollars") as p95,'
+            "  percentile_cont(0.99) WITHIN GROUP"
+            '    (ORDER BY "costMicrodollars") as p99'
+            ' FROM {schema_prefix}"PlatformCostLog"'
+            " WHERE \"trackingType\" = 'cost_usd'"
+            ' AND "createdAt" >= $1',
+            start,
+        ),
+        # Histogram buckets for cost distribution.
+        query_raw_with_schema(
+            "SELECT"
+            "  CASE"
+            '    WHEN "costMicrodollars" < 500000'
+            "      THEN '$0-0.50'"
+            '    WHEN "costMicrodollars" < 1000000'
+            "      THEN '$0.50-1'"
+            '    WHEN "costMicrodollars" < 2000000'
+            "      THEN '$1-2'"
+            '    WHEN "costMicrodollars" < 5000000'
+            "      THEN '$2-5'"
+            '    WHEN "costMicrodollars" < 10000000'
+            "      THEN '$5-10'"
+            "    ELSE '$10+'"
+            "  END as bucket,"
+            "  COUNT(*) as count"
+            ' FROM {schema_prefix}"PlatformCostLog"'
+            " WHERE \"trackingType\" = 'cost_usd'"
+            ' AND "createdAt" >= $1'
+            " GROUP BY bucket"
+            ' ORDER BY MIN("costMicrodollars")',
+            start,
+        ),
    )

    # Sort by_provider by total cost descending and cap at MAX_PROVIDER_ROWS.
@@ -334,6 +385,18 @@ async def get_platform_cost_dashboard(
    total_input_tokens = sum(_si(r, "inputTokens") for r in total_agg_groups)
    total_output_tokens = sum(_si(r, "outputTokens") for r in total_agg_groups)

+    # Extract percentile values from the raw query result.
+    pctl = percentile_rows[0] if percentile_rows else {}
+    cost_p50 = float(pctl.get("p50") or 0)
+    cost_p75 = float(pctl.get("p75") or 0)
+    cost_p95 = float(pctl.get("p95") or 0)
+    cost_p99 = float(pctl.get("p99") or 0)
+
+    # Build cost bucket list.
+    cost_buckets = [
+        {"bucket": r["bucket"], "count": int(r["count"])} for r in bucket_rows
+    ]
+
    # Cost-bearing request count: only rows where trackingType == "cost_usd".
    cost_bearing_requests = sum(
        _ca(r) for r in total_agg_groups if r.get("trackingType") == "cost_usd"
@@ -385,6 +448,11 @@ async def get_platform_cost_dashboard(
        avg_cost_microdollars_per_request=(
            total_cost / cost_bearing_requests if cost_bearing_requests > 0 else 0.0
        ),
+        cost_p50_microdollars=cost_p50,
+        cost_p75_microdollars=cost_p75,
+        cost_p95_microdollars=cost_p95,
+        cost_p99_microdollars=cost_p99,
+        cost_buckets=cost_buckets,
    )


--- a/autogpt_platform/frontend/src/app/(platform)/admin/platform-costs/components/PlatformCostContent.tsx
+++ b/autogpt_platform/frontend/src/app/(platform)/admin/platform-costs/components/PlatformCostContent.tsx
@@ -215,52 +215,100 @@ export function PlatformCostContent({ searchParams }: Props) {
      ) : (
        <>
          {dashboard && (
-            <div className="grid grid-cols-2 gap-4 sm:grid-cols-3 md:grid-cols-4">
-              <SummaryCard
-                label="Known Cost"
-                value={formatMicrodollars(dashboard.total_cost_microdollars)}
-                subtitle="From providers that report USD cost"
-              />
-              <SummaryCard
-                label="Estimated Total"
-                value={formatMicrodollars(totalEstimatedCost)}
-                subtitle="Including per-run cost estimates"
-              />
-              <SummaryCard
-                label="Total Requests"
-                value={dashboard.total_requests.toLocaleString()}
-              />
-              <SummaryCard
-                label="Active Users"
-                value={dashboard.total_users.toLocaleString()}
-              />
-              <SummaryCard
-                label="Avg Cost / Request"
-                value={formatMicrodollars(
-                  dashboard.avg_cost_microdollars_per_request ?? 0,
-                )}
-                subtitle="Known cost divided by total requests"
-              />
-              <SummaryCard
-                label="Avg Input Tokens"
-                value={Math.round(
-                  dashboard.avg_input_tokens_per_request ?? 0,
-                ).toLocaleString()}
-                subtitle="Prompt tokens per request (context size)"
-              />
-              <SummaryCard
-                label="Avg Output Tokens"
-                value={Math.round(
-                  dashboard.avg_output_tokens_per_request ?? 0,
-                ).toLocaleString()}
-                subtitle="Completion tokens per request (response length)"
-              />
-              <SummaryCard
-                label="Total Tokens"
-                value={`${formatTokens(dashboard.total_input_tokens ?? 0)} in / ${formatTokens(dashboard.total_output_tokens ?? 0)} out`}
-                subtitle="Prompt vs completion token split"
-              />
-            </div>
+            <>
+              <div className="grid grid-cols-2 gap-4 sm:grid-cols-3 md:grid-cols-4">
+                <SummaryCard
+                  label="Known Cost"
+                  value={formatMicrodollars(dashboard.total_cost_microdollars)}
+                  subtitle="From providers that report USD cost"
+                />
+                <SummaryCard
+                  label="Estimated Total"
+                  value={formatMicrodollars(totalEstimatedCost)}
+                  subtitle="Including per-run cost estimates"
+                />
+                <SummaryCard
+                  label="Total Requests"
+                  value={dashboard.total_requests.toLocaleString()}
+                />
+                <SummaryCard
+                  label="Active Users"
+                  value={dashboard.total_users.toLocaleString()}
+                />
+                <SummaryCard
+                  label="Avg Cost / Request"
+                  value={formatMicrodollars(
+                    dashboard.avg_cost_microdollars_per_request ?? 0,
+                  )}
+                  subtitle="Known cost divided by total requests"
+                />
+                <SummaryCard
+                  label="Avg Input Tokens"
+                  value={Math.round(
+                    dashboard.avg_input_tokens_per_request ?? 0,
+                  ).toLocaleString()}
+                  subtitle="Prompt tokens per request (context size)"
+                />
+                <SummaryCard
+                  label="Avg Output Tokens"
+                  value={Math.round(
+                    dashboard.avg_output_tokens_per_request ?? 0,
+                  ).toLocaleString()}
+                  subtitle="Completion tokens per request (response length)"
+                />
+                <SummaryCard
+                  label="Total Tokens"
+                  value={`${formatTokens(dashboard.total_input_tokens ?? 0)} in / ${formatTokens(dashboard.total_output_tokens ?? 0)} out`}
+                  subtitle="Prompt vs completion token split"
+                />
+                <SummaryCard
+                  label="P50 Cost / Request"
+                  value={formatMicrodollars(
+                    dashboard.cost_p50_microdollars ?? 0,
+                  )}
+                  subtitle="Median cost per request"
+                />
+                <SummaryCard
+                  label="P95 Cost / Request"
+                  value={formatMicrodollars(
+                    dashboard.cost_p95_microdollars ?? 0,
+                  )}
+                  subtitle="95th percentile cost"
+                />
+                <SummaryCard
+                  label="P99 Cost / Request"
+                  value={formatMicrodollars(
+                    dashboard.cost_p99_microdollars ?? 0,
+                  )}
+                  subtitle="99th percentile cost"
+                />
+              </div>
+
+              {dashboard.cost_buckets && dashboard.cost_buckets.length > 0 && (
+                <div className="rounded-lg border p-4">
+                  <h3 className="mb-3 text-sm font-medium">
+                    Cost Distribution by Bucket
+                  </h3>
+                  <div className="grid grid-cols-2 gap-2 sm:grid-cols-3 md:grid-cols-6">
+                    {dashboard.cost_buckets.map(
+                      (b: { bucket: string; count: number }) => (
+                        <div
+                          key={b.bucket}
+                          className="flex flex-col items-center rounded border p-2 text-center"
+                        >
+                          <span className="text-xs text-muted-foreground">
+                            {b.bucket}
+                          </span>
+                          <span className="text-lg font-semibold">
+                            {b.count.toLocaleString()}
+                          </span>
+                        </div>
+                      ),
+                    )}
+                  </div>
+                </div>
+              )}
+            </>
          )}

          <div
--- a/autogpt_platform/frontend/src/app/api/openapi.json
+++ b/autogpt_platform/frontend/src/app/api/openapi.json
@@ -12146,7 +12146,12 @@
          "total_output_tokens": { "type": "integer", "title": "Total Output Tokens", "default": 0 },
          "avg_input_tokens_per_request": { "type": "number", "title": "Avg Input Tokens Per Request", "default": 0.0 },
          "avg_output_tokens_per_request": { "type": "number", "title": "Avg Output Tokens Per Request", "default": 0.0 },
-          "avg_cost_microdollars_per_request": { "type": "number", "title": "Avg Cost Microdollars Per Request", "default": 0.0 }
+          "avg_cost_microdollars_per_request": { "type": "number", "title": "Avg Cost Microdollars Per Request", "default": 0.0 },
+          "cost_p50_microdollars": { "type": "number", "title": "Cost P50 Microdollars", "default": 0.0 },
+          "cost_p75_microdollars": { "type": "number", "title": "Cost P75 Microdollars", "default": 0.0 },
+          "cost_p95_microdollars": { "type": "number", "title": "Cost P95 Microdollars", "default": 0.0 },
+          "cost_p99_microdollars": { "type": "number", "title": "Cost P99 Microdollars", "default": 0.0 },
+          "cost_buckets": { "type": "array", "items": { "type": "object" }, "title": "Cost Buckets", "default": [] }
        },
        "type": "object",
        "required": [