Files
sim/apps/docs/content/docs/ja/execution/costs.mdx
2025-12-22 20:09:03 -08:00

240 lines
10 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: コスト計算
---
import { Callout } from 'fumadocs-ui/components/callout'
import { Tab, Tabs } from 'fumadocs-ui/components/tabs'
import { Image } from '@/components/ui/image'
Simはすべてのワークフロー実行のコストを自動的に計算し、AIモデルの使用量と実行料金に基づいた透明な価格設定を提供します。これらのコストを理解することで、ワークフローを最適化し、予算を効果的に管理することができます。
## コストの計算方法
すべてのワークフロー実行には、次の2つのコスト要素が含まれます
**基本実行料金**1回の実行につき$0.001
**AIモデル使用料**:トークン消費量に基づく変動コスト
```javascript
modelCost = (inputTokens × inputPrice + outputTokens × outputPrice) / 1,000,000
totalCost = baseExecutionCharge + modelCost
```
<Callout type="info">
AIモデルの価格は100万トークンあたりの金額です。実際のコストを算出するために1,000,000で割ります。AIブロックを使用しないワークフローは基本実行料金のみが発生します。
</Callout>
## ログでのモデル内訳
AIブロックを使用するワークフローでは、ログで詳細なコスト情報を確認できます
<div className="flex justify-center">
<Image
src="/static/logs/logs-cost.png"
alt="モデル内訳"
width={600}
height={400}
className="my-6"
/>
</div>
モデル内訳には以下が表示されます:
- **トークン使用量**:各モデルの入力および出力トークン数
- **コスト内訳**:モデルごとおよび操作ごとの個別コスト
- **モデル分布**:使用されたモデルとその回数
- **総コスト**:ワークフロー実行全体の合計コスト
## 料金オプション
<Tabs items={['Hosted Models', 'Bring Your Own API Key']}>
<Tab>
**ホステッドモデル** - Simは2倍の価格乗数でAPIキーを提供します
**OpenAI**
| モデル | 基本価格(入力/出力) | ホステッド価格(入力/出力) |
|-------|---------------------------|----------------------------|
| GPT-5.1 | $1.25 / $10.00 | $2.50 / $20.00 |
| GPT-5 | $1.25 / $10.00 | $2.50 / $20.00 |
| GPT-5 Mini | $0.25 / $2.00 | $0.50 / $4.00 |
| GPT-5 Nano | $0.05 / $0.40 | $0.10 / $0.80 |
| GPT-4o | $2.50 / $10.00 | $5.00 / $20.00 |
| GPT-4.1 | $2.00 / $8.00 | $4.00 / $16.00 |
| GPT-4.1 Mini | $0.40 / $1.60 | $0.80 / $3.20 |
| GPT-4.1 Nano | $0.10 / $0.40 | $0.20 / $0.80 |
| o1 | $15.00 / $60.00 | $30.00 / $120.00 |
| o3 | $2.00 / $8.00 | $4.00 / $16.00 |
| o4 Mini | $1.10 / $4.40 | $2.20 / $8.80 |
**Anthropic**
| モデル | 基本価格(入力/出力) | ホステッド価格(入力/出力) |
|-------|---------------------------|----------------------------|
| Claude Opus 4.5 | $5.00 / $25.00 | $10.00 / $50.00 |
| Claude Opus 4.1 | $15.00 / $75.00 | $30.00 / $150.00 |
| Claude Sonnet 4.5 | $3.00 / $15.00 | $6.00 / $30.00 |
| Claude Sonnet 4.0 | $3.00 / $15.00 | $6.00 / $30.00 |
| Claude Haiku 4.5 | $1.00 / $5.00 | $2.00 / $10.00 |
**Google**
| モデル | 基本価格(入力/出力) | ホステッド価格(入力/出力) |
|-------|---------------------------|----------------------------|
| Gemini 3 Pro Preview | $2.00 / $12.00 | $4.00 / $24.00 |
| Gemini 2.5 Pro | $1.25 / $10.00 | $2.50 / $20.00 |
| Gemini 2.5 Flash | $0.30 / $2.50 | $0.60 / $5.00 |
*2倍の乗数は、インフラストラクチャとAPI管理コストをカバーします。*
</Tab>
<Tab>
**独自のAPIキー** - 基本価格で任意のモデルを使用:
| プロバイダー | モデル例 | 入力 / 出力 |
|----------|----------------|----------------|
| Deepseek | V3, R1 | $0.75 / $1.00 |
| xAI | Grok 4 Latest, Grok 3 | $3.00 / $15.00 |
| Groq | Llama 4 Scout, Llama 3.3 70B | $0.11 / $0.34 |
| Cerebras | Llama 4 Scout, Llama 3.3 70B | $0.11 / $0.34 |
| Ollama | ローカルモデル | 無料 |
| VLLM | ローカルモデル | 無料 |
*プロバイダーに直接支払い、マークアップなし*
</Tab>
</Tabs>
<Callout type="warning">
表示価格は2025年9月10日時点のレートを反映しています。最新の価格については各プロバイダーのドキュメントをご確認ください。
</Callout>
## コスト最適化戦略
- **モデル選択**: タスクの複雑さに基づいてモデルを選択してください。単純なタスクにはGPT-4.1-nanoを使用し、複雑な推論にはo1やClaude Opusが必要な場合があります。
- **プロンプトエンジニアリング**: 構造化された簡潔なプロンプトは、品質を犠牲にすることなくトークン使用量を削減します。
- **ローカルモデル**: 重要度の低いタスクにはOllamaやVLLMを使用して、API費用を完全に排除します。
- **キャッシュと再利用**: 頻繁に使用される結果を変数やファイルに保存して、AIモデル呼び出しの繰り返しを避けます。
- **バッチ処理**: 個別の呼び出しを行うのではなく、単一のAIリクエストで複数のアイテムを処理します。
## 使用状況モニタリング
設定 → サブスクリプションで使用状況と請求を監視できます:
- **現在の使用状況**: 現在の期間のリアルタイムの使用状況とコスト
- **使用制限**: 視覚的な進捗指標付きのプラン制限
- **請求詳細**: 予測される料金と最低利用額
- **プラン管理**: アップグレードオプションと請求履歴
### プログラムによる使用状況の追跡
APIを使用して、現在の使用状況と制限をプログラムで照会できます
**エンドポイント:**
```text
GET /api/users/me/usage-limits
```
**認証:**
- APIキーを `X-API-Key` ヘッダーに含めてください
**リクエスト例:**
```bash
curl -X GET -H "X-API-Key: YOUR_API_KEY" -H "Content-Type: application/json" https://sim.ai/api/users/me/usage-limits
```
**レスポンス例:**
```json
{
"success": true,
"rateLimit": {
"sync": {
"isLimited": false,
"requestsPerMinute": 25,
"maxBurst": 50,
"remaining": 50,
"resetAt": "2025-09-08T22:51:55.999Z"
},
"async": {
"isLimited": false,
"requestsPerMinute": 200,
"maxBurst": 400,
"remaining": 400,
"resetAt": "2025-09-08T22:51:56.155Z"
},
"authType": "api"
},
"usage": {
"currentPeriodCost": 12.34,
"limit": 100,
"plan": "pro"
}
}
```
**レート制限フィールド:**
- `requestsPerMinute`:持続的なレート制限(トークンはこの速度で補充されます)
- `maxBurst`:蓄積できる最大トークン数(バースト容量)
- `remaining`:現在利用可能なトークン(最大で`maxBurst`まで)
**レスポンスフィールド:**
- `currentPeriodCost`は現在の請求期間の使用状況を反映します
- `limit`は個別の制限(無料/プロ)または組織のプール制限(チーム/エンタープライズ)から派生します
- `plan`はユーザーに関連付けられた最優先のアクティブなプランです
## プラン制限
サブスクリプションプランによって使用制限が異なります:
| プラン | 月間使用制限 | レート制限(毎分) |
|------|-------------------|-------------------------|
| **Free** | $20 | 同期5、非同期10 |
| **Pro** | $100 | 同期10、非同期50 |
| **Team** | $500プール | 同期50、非同期100 |
| **Enterprise** | カスタム | カスタム |
## 課金モデル
Simは**基本サブスクリプション+超過分**の課金モデルを使用しています:
### 仕組み
**プロプラン(月額$20**
- 月額サブスクリプションには$20分の使用量が含まれます
- 使用量が$20未満 → 追加料金なし
- 使用量が$20を超える → 月末に超過分を支払い
- 例:$35の使用量 = $20サブスクリプション+ $15超過分
**チームプラン(席あたり月額$40**
- チームメンバー全体でプールされた使用量
- チーム全体の使用量から超過分を計算
- 組織のオーナーが一括で請求を受ける
**エンタープライズプラン:**
- 固定月額料金、超過料金なし
- 契約に基づくカスタム使用制限
### しきい値課金
未請求の超過分が$50に達すると、Simは自動的に未請求の全額を請求します。
**例:**
- 10日目$70の超過分 → 即時に$70を請求
- 15日目追加$35の使用合計$105 → すでに請求済み、アクションなし
- 20日目さらに$50の使用合計$155、未請求$85 → 即時に$85を請求
これにより、期間終了時に一度に大きな請求が発生するのではなく、月全体に大きな超過料金が分散されます。
## コスト管理のベストプラクティス
1. **定期的な監視**: 予期せぬ事態を避けるため、使用状況ダッシュボードを頻繁に確認する
2. **予算の設定**: プランの制限を支出のガードレールとして使用する
3. **ワークフローの最適化**: コストの高い実行を見直し、プロンプトやモデル選択を最適化する
4. **適切なモデルの使用**: タスクの要件にモデルの複雑さを合わせる
5. **類似タスクのバッチ処理**: 可能な場合は複数のリクエストを組み合わせてオーバーヘッドを削減する
## 次のステップ
- [設定 → サブスクリプション](https://sim.ai/settings/subscription)で現在の使用状況を確認する
- 実行詳細を追跡するための[ロギング](/execution/logging)について学ぶ
- プログラムによるコスト監視のための[外部API](/execution/api)を探索する
- コスト削減のための[ワークフロー最適化テクニック](/blocks)をチェックする