模型配置
真正推荐的不是单个模型赢家,而是一套模型栈:强主力模型负责难任务,便宜 Fallback 承担日常流量,免费或本地模型承担低价值任务。
推荐组合:Sonnet → Haiku → DeepSeek
这是 2026 年 3 月最平衡的社区默认路线。Claude Sonnet 负责高价值 Agent 任务,Haiku 吃掉轻量溢出,DeepSeek 用来把日常成本压下来。
核心模型路线
| 提供商与模型 | 推理能力 | 成本 | 隐私 / 运行方式 | 操作 |
|---|---|---|---|---|
Claude Sonnet 4.6 Agent 与工具调用默认首选 | ★★★★★ | $3.00 输入 / $15.00 输出 | 云 API | 指南 |
DeepSeek-V3.2 日常使用和代码任务的极致性价比 | ★★★★★ | $0.14 输入 / $0.28 输出 | 云 API | 总览 |
GLM-5 国产代码能力强,下面还有免费 Flash 档兜底 | ★★★★★ | $0.80 输入 / $2.56 输出 | 云 API | 总览 |
Gemini Flash 适合心跳、定时任务和低价值后台工作 | ★★★★★ | 有免费额度 | 云 API | 总览 |
Ollama + Qwen / Devstral 本地私有运行,但硬件门槛是真实存在的 | ★★★★★ | $0 API 成本 | 本地运行 | 总览 |
三种起步策略
策略一:免费 / 本地
低成本到零成本
适合实验、学习与隐私敏感场景
- •如果机器够强,可以上 Ollama 或 LM Studio
- •免费 Flash 模型适合心跳和简单任务
- •非常适合低价值任务和早期试验
- •较大本地模型会明显受限于硬件和冷启动速度
最实用
策略二:国产性价比
$5 到 $15 / 月
适合国内用户平衡成本与效果
- •GLM-5、DeepSeek、Kimi、MiniMax 或云平台 Coding Plan
- •用免费 Flash 模型跑 Cron 和低价值流量
- •即使 Claude 是主力,也建议把 DeepSeek 或 GLM 放进 Fallback
- •非常适合阿里云、腾讯云、火山引擎路线
策略三:混合最优
$10 到 $30 / 月
质量与成本最平衡
- •主力:Claude Sonnet 4.6
- •Fallback:Claude Haiku 4.5 与 DeepSeek-V3.2
- •心跳和定时任务用 Gemini Flash 或本地模型
- •一定要加预算上限,避免高价模型夜间跑飞