2026 3月api_key Top 30

25次阅读
没有评论

共计 3086 个字符,预计需要花费 8 分钟才能阅读完成。

“2026 年 3 月主流 API 模型” 来排,重点看 4 个维度:综合效果、代码 /Agent、上下文、价格
口径上,价格尽量取官方按量价的主档位 (通常是最低常用文本档), 不含缓存命中、Batch、活动价 参数规模只写公开值,没公开的就标“未公开”。(DeepSeek API Docs)

  1. Kimi K2.5 — 月之暗面;1T 总参 / 32B 激活$0.60 in / $3.00 out / 1M256K。现在看是国内 API 里最强的“重度 Agent + 办公自动化 + 视觉编码”之一。(Moonshot AI)
  2. GLM-5 — 智谱;参数未公开 ¥6 in / ¥22 out / 1M(公开价页);主打复杂系统工程与长程 Agent。( 智谱 AI)
  3. DeepSeek-chat — DeepSeek;671B 总参 / 37B 激活$0.28 miss-in / $0.42 out / 1M,cache hit $0.028;128K。目前仍是国内最强性价比之一。(DeepSeek API Docs)
  4. GLM-4.7 — 智谱;355B 总参 / 32B 激活$0.60 in / $2.20 out / 1M200K。2026 上半年国内代码 /Agent 一线旗舰。(GitHub)
  5. Qwen3-Max — 阿里;参数未公开 $0.359 in / $1.434 out / 1M(≤32K 档); 最高 252K。企业接入和通用任务都很稳。(alibabacloud.com)
  6. MiniMax-M2.5 — MiniMax;230B$0.30 in / $1.20 out / 1M;主打代码、推理、Office。(MiniMax API Docs)
  7. Tencent HY 2.0 Think — 腾讯混元;参数未公开 ¥3.975 in / ¥15.9 out / 1M(≤32K 档);128K。偏复杂推理。( 腾讯云)
  8. Doubao-Seed-2.0-pro — 字节 / 火山;参数未公开¥3.2 in / ¥16 out / 1M。适合大厂生态内落地。(GitHub)
  9. Step-3.5-Flash — 阶跃星辰;196B 总参 / 11B 激活 ¥0.7 in / ¥2.1 out / 1M256K。2026 很强的“便宜又快”的 Agent 模型。( 阶跃星辰)
  10. DeepSeek-reasoner — DeepSeek;与 V3.2 API 版本对应$0.28 miss-in / $0.42 out / 1M128K。适合需要思考链的复杂任务。(DeepSeek API Docs)
  11. Kimi K2 Thinking — 月之暗面;1T 总参 / 32B 激活(K2 系)$0.60 in / $2.50 out / 1M。更偏推理和多步工具调用。(Moonshot AI)
  12. Qwen3.5-Plus — 阿里;参数未公开 $0.115 in / $0.688 out / 1M(≤128K 档); 最高 1M 上下文档位 。很适合企业常规主力模型。( 阿里云)
  13. MiniMax-M2.1 — MiniMax;230B 总参 / 10B 激活$0.30 in / $1.20 out / 1M。偏代码与 Agent。(MiniMax API Docs)
  14. Tencent HY 2.0 Instruct — 腾讯混元;参数未公开 ¥3.18 in / ¥7.95 out / 1M(≤32K 档);128K。比 Think 更偏通用指令场景。( 腾讯云)
  15. Step-3 — 阶跃星辰;参数未公开 ¥1.5 in / ¥4 out / 1M(小输入且小输出档),大输出档到 ¥8 out。( 阶跃星辰)
  16. GLM-4.5-Air — 智谱;106B 总参 / 12B 激活$0.20 in / $1.10 out / 1M。是 GLM 体系里很实用的轻量旗舰。(GitHub)
  17. Qwen3.5-397B-A17B — 阿里;397B 总参 / 17B 激活 $0.172 in / $1.032 out / 1M(中国内地 ≤128K 档)。( 阿里云)
  18. MiniMax-M2 — MiniMax;230B 总参 / 10B 激活$0.30 in / $1.20 out / 1M。更偏低延迟 Agent 与 coding workflows。(MiniMax)
  19. Hunyuan-TurboS — 腾讯混元;参数未公开 ¥0.8 in / ¥2 out / 1M。快思考、低成本。( 腾讯云)
  20. Doubao-Seed-2.0-lite — 字节 / 火山;参数未公开¥0.6 in / ¥3.6 out / 1M。(GitHub)
  21. Qwen3.5-122B-A10B — 阿里;122B 总参 / 10B 激活 $0.115 in / $0.917 out / 1M(中国内地 ≤128K 档)。( 阿里云)
  22. GLM-4.6V — 智谱;参数未公开¥1 in / ¥3 out / 1M(公开汇总);偏视觉理解与多模态任务。(GitHub)
  23. Hunyuan-a13b — 腾讯混元;13B¥0.5 in / ¥2 out / 1M;最长输入 224K。是腾讯体系里很值得关注的小而强模型。(腾讯云)
  24. Qwen3.5-27B — 阿里;27B$0.086 in / $0.688 out / 1M(中国内地 ≤128K 档)。(阿里云)
  25. GLM-4.7-FlashX — 智谱;参数未公开$0.07 in / $0.40 out / 1M200K。高性价比高速版。(Z.AI)
  26. Doubao-Seed-2.0-mini — 字节 / 火山;参数未公开¥0.2 in / ¥2 out / 1M。极低门槛的产品化模型。(volcengine.com)
  27. Qwen3.5-35B-A3B — 阿里;35B 总参 / 3B 激活 $0.057 in / $0.459 out / 1M(中国内地 ≤128K 档)。( 阿里云)
  28. GLM-Z1-FlashX — 智谱;参数未公开¥0.1 in / ¥0.1 out / 1M(公开汇总)。更像极致低价入口。(GitHub)
  29. Qwen3.5-Flash — 阿里;参数未公开 $0.029 in / $0.287 out / 1M(全球部署 ≤128K 档)。非常适合高并发客服、摘要、改写。( 阿里云)
  30. GLM-4.7-Flash — 智谱;30B 级 免费 200K。如果你想先做 PoC,它是 2026 国内最值得先试的免费模型之一。( 智谱 AI)

读这个榜单时,最重要的 3 个结论

第一,2026 国内 API 已经明显分层了:
顶层是 Kimi K2.5、GLM-5、DeepSeek-V3.2、GLM-4.7、Qwen3-Max、MiniMax-M2.5 这批,适合做高价值 Agent、代码、复杂工作流。(Kimi)

第二,性价比最卷的是 DeepSeek / Step / Qwen 开源线 / GLM Flash 线。
DeepSeek 现在官方价仍然非常低;Step-3.5-Flash 把 196B 级模型压到很便宜;阿里 Qwen3.5 开源系和智谱 FlashX/Flash 则把“可用”门槛压得更低。(DeepSeek API Docs)

第三,如果你是做真正商用产品,别只看单价。
还要同时看:上下文长度、是否支持思考模式、工具调用、速率限制、缓存折扣、是否有免费 / 试用档。比如 Kimi、GLM、Qwen、DeepSeek 都在这些维度上差异很大。(Moonshot AI)

选型建议

AI 编码 / Agent:优先看 Kimi K2.5、GLM-5、GLM-4.7、MiniMax-M2.5、Step-3.5-Flash。(Kimi)

低成本 SaaS / 高并发机器人:优先看 DeepSeek-chat、Qwen3.5-Flash、GLM-4.7-FlashX、Doubao-Seed-2.0-mini、Hunyuan-TurboS。(DeepSeek API Docs)

企业级稳定接入 :优先看 Qwen3-Max / Qwen3.5-Plus、腾讯 HY 2.0、豆包 2.0、GLM-4.7/5。( 阿里云)

先试再上量 :优先试 GLM-4.7-Flash、GLM-4-Flash、GLM-4.5-Flash 这类免费模型。( 智谱 AI 开放文档)

正文完
 0
一诺
版权声明:本站原创文章,由 一诺 于2026-03-06发表,共计3086字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)
验证码