模型配置

真正推荐的不是单个模型赢家,而是一套模型栈:强主力模型负责难任务,便宜 Fallback 承担日常流量,免费或本地模型承担低价值任务。

推荐组合:Sonnet → Haiku → DeepSeek

这是 2026 年 3 月最平衡的社区默认路线。Claude Sonnet 负责高价值 Agent 任务,Haiku 吃掉轻量溢出,DeepSeek 用来把日常成本压下来。

查看推荐模型栈

核心模型路线

提供商与模型推理能力成本隐私 / 运行方式操作
Claude Sonnet 4.6
Agent 与工具调用默认首选
$3.00 输入 / $15.00 输出云 API指南
DeepSeek-V3.2
日常使用和代码任务的极致性价比
$0.14 输入 / $0.28 输出云 API总览
GLM-5
国产代码能力强,下面还有免费 Flash 档兜底
$0.80 输入 / $2.56 输出云 API总览
Gemini Flash
适合心跳、定时任务和低价值后台工作
有免费额度云 API总览
Ollama + Qwen / Devstral
本地私有运行,但硬件门槛是真实存在的
$0 API 成本本地运行总览

三种起步策略

策略一:免费 / 本地

低成本到零成本

适合实验、学习与隐私敏感场景

  • 如果机器够强,可以上 Ollama 或 LM Studio
  • 免费 Flash 模型适合心跳和简单任务
  • 非常适合低价值任务和早期试验
  • 较大本地模型会明显受限于硬件和冷启动速度
最实用
策略二:国产性价比

$5 到 $15 / 月

适合国内用户平衡成本与效果

  • GLM-5、DeepSeek、Kimi、MiniMax 或云平台 Coding Plan
  • 用免费 Flash 模型跑 Cron 和低价值流量
  • 即使 Claude 是主力,也建议把 DeepSeek 或 GLM 放进 Fallback
  • 非常适合阿里云、腾讯云、火山引擎路线
策略三:混合最优

$10 到 $30 / 月

质量与成本最平衡

  • 主力:Claude Sonnet 4.6
  • Fallback:Claude Haiku 4.5 与 DeepSeek-V3.2
  • 心跳和定时任务用 Gemini Flash 或本地模型
  • 一定要加预算上限,避免高价模型夜间跑飞