人性化的克勞德
- Claude Opus 4.7 旗艦推理、長背景、架構和策略工作。
- Claude Opus 4.6 上一代 Opus 可實現穩定、高品質的分析。
- Claude Sonnet 4.6 日常驅動程式-編碼、編寫和多步驟代理循環。
- Claude Sonnet 4.5 / 4 快速 Sonnet 層,可對支援的工作負載進行即時快取。
- Claude Haiku 4.5 低延遲草稿、分類和大容量子任務。
為每個代理程式分配預設模型或為每個任務覆蓋。使用量以您的計劃餘額中的 Digio 代幣計量——無論代理呼叫 Sonnet、GPT-4o 還是 Gemini Flash,都是同一個錢包。
Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.
協調員可以根據任務類型推薦 Sonnet、Opus 和更便宜的快閃記憶體模型。進階使用者為每個代理角色設定預設值 - Sonnet 的研究、Opus 的最終審查、Haiku 或 Gemini Flash 的批次標記。
Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.
需要微調、氣隙檢查點或可預測的推理定價?在您的 Digio 工作區中新增專用 GPU 容量,安裝您喜歡的服務堆疊,並在您的專用端點處指定代理程式。
按小時或按月計算的 GPU 節點(A100、H100、L40S 級)連接到您的租戶 — 與其他客戶隔離。
上傳安全張量、GGUF,或從您的註冊表中提取;運行 Llama、Mistral、Qwen 和自訂微調。
vLLM、TGI、Ollama 或您維護的容器映像 - Digio 代理程式呼叫與 OpenAI 相容的基本 URL。
要做的事情、團隊聊天、技能和協作不變——只有推理後端是你的。
將敏感步驟傳送到專用 GPU,並在一個工作流程中使用 Claude 或 GPT 進行公共研究。
受監管團隊的 VPC 對等、靜態出口、審核日誌和模型許可名單。
從零到代理呼叫您的端點的典型設定:
選擇 VRAM、區域和正常運作時間(突發與始終開啟)。重量儲存隨實例一起提供或安裝在您的儲存桶上。
啟動服務映像或 SSH,安裝 CUDA 驅動程式並載入檢查點。健康檢查確認模型已準備就緒。
在工作區設定中新增基本 URL、API 金鑰和模型 ID。 Digio 在上線前會驗證延遲和令牌格式。
選擇您的私人模特兒作為所選代理商的預設模特兒;託管的 Claude/GPT 型號仍然可以並排使用。
GPU 租賃費用與 Digio 方案訂閱分開計費。請聯絡我們以了解容量規劃、SLA 以及從現有推理集群的遷移。
選擇託管 API 與 Digio 上的自架推理。
您的 Digio 訂閱涵蓋基礎設施、代理和包含的 Digio 代幣。託管模型使用量按實際輸入/輸出令牌借記令牌餘額。 GPU 租賃是您控制的機器的附加組件。
是的,每個代理都可以有自己的預設值。任務和聊天可以覆蓋單次運行,而不更改全域預設值。
Opus 已針對更難的推理和更長的連貫計劃進行了調整;對於日常代理循環來說,Sonnet 更快、更便宜。 Haiku 和 flash 級模型最適合批次子任務。
企業工作區可以限制出站模型提供者並將所有代理流量路由到您的 GPU 端點。混合模式是大多數團隊的預設模式。
產品取決於地區和需求,通常為 7B-70B 級型號提供 24-80 GB VRAM 層,為更大的堆疊提供多 GPU 節點。我們根據參數計數和量化來幫助您確定 VRAM 的大小。
編排(代理、任務、儲存)保留在您的計劃中。 GPU 上的推理按 GPU 時間計費;您可以選擇計量令牌形式的使用情況以進行內部退款。
代理、任務和技能—圍繞您選擇的模型的工作區。