2026 3月api_key Top 30

共计 3086 个字符，预计需要花费 8 分钟才能阅读完成。

“2026 年 3 月主流 API 模型” 来排，重点看 4 个维度：综合效果、代码 /Agent、上下文、价格 。
口径上，价格尽量取官方按量价的主档位 （通常是最低常用文本档）， 不含缓存命中、Batch、活动价 ； 参数规模只写公开值，没公开的就标“未公开”。(DeepSeek API Docs)

Kimi K2.5 — 月之暗面；1T 总参 / 32B 激活；$0.60 in / $3.00 out / 1M；256K。现在看是国内 API 里最强的“重度 Agent + 办公自动化 + 视觉编码”之一。(Moonshot AI)
GLM-5 — 智谱；参数未公开 ；¥6 in / ¥22 out / 1M（公开价页）；主打复杂系统工程与长程 Agent。( 智谱 AI)
DeepSeek-chat — DeepSeek；671B 总参 / 37B 激活；$0.28 miss-in / $0.42 out / 1M，cache hit $0.028；128K。目前仍是国内最强性价比之一。(DeepSeek API Docs)
GLM-4.7 — 智谱；355B 总参 / 32B 激活；$0.60 in / $2.20 out / 1M；200K。2026 上半年国内代码 /Agent 一线旗舰。(GitHub)
Qwen3-Max — 阿里；参数未公开 ；$0.359 in / $1.434 out / 1M（≤32K 档）； 最高 252K。企业接入和通用任务都很稳。(alibabacloud.com)
MiniMax-M2.5 — MiniMax；230B；$0.30 in / $1.20 out / 1M；主打代码、推理、Office。(MiniMax API Docs)
Tencent HY 2.0 Think — 腾讯混元；参数未公开 ；¥3.975 in / ¥15.9 out / 1M（≤32K 档）；128K。偏复杂推理。( 腾讯云)
Doubao-Seed-2.0-pro — 字节 / 火山；参数未公开；¥3.2 in / ¥16 out / 1M。适合大厂生态内落地。(GitHub)
Step-3.5-Flash — 阶跃星辰；196B 总参 / 11B 激活 ；¥0.7 in / ¥2.1 out / 1M；256K。2026 很强的“便宜又快”的 Agent 模型。( 阶跃星辰)
DeepSeek-reasoner — DeepSeek；与 V3.2 API 版本对应；$0.28 miss-in / $0.42 out / 1M；128K。适合需要思考链的复杂任务。(DeepSeek API Docs)
Kimi K2 Thinking — 月之暗面；1T 总参 / 32B 激活（K2 系）；$0.60 in / $2.50 out / 1M。更偏推理和多步工具调用。(Moonshot AI)
Qwen3.5-Plus — 阿里；参数未公开 ；$0.115 in / $0.688 out / 1M（≤128K 档）； 最高 1M 上下文档位 。很适合企业常规主力模型。( 阿里云)
MiniMax-M2.1 — MiniMax；230B 总参 / 10B 激活；$0.30 in / $1.20 out / 1M。偏代码与 Agent。(MiniMax API Docs)
Tencent HY 2.0 Instruct — 腾讯混元；参数未公开 ；¥3.18 in / ¥7.95 out / 1M（≤32K 档）；128K。比 Think 更偏通用指令场景。( 腾讯云)
Step-3 — 阶跃星辰；参数未公开 ；¥1.5 in / ¥4 out / 1M（小输入且小输出档），大输出档到 ¥8 out。( 阶跃星辰)
GLM-4.5-Air — 智谱；106B 总参 / 12B 激活；$0.20 in / $1.10 out / 1M。是 GLM 体系里很实用的轻量旗舰。(GitHub)
Qwen3.5-397B-A17B — 阿里；397B 总参 / 17B 激活 ；$0.172 in / $1.032 out / 1M（中国内地 ≤128K 档）。( 阿里云)
MiniMax-M2 — MiniMax；230B 总参 / 10B 激活；$0.30 in / $1.20 out / 1M。更偏低延迟 Agent 与 coding workflows。(MiniMax)
Hunyuan-TurboS — 腾讯混元；参数未公开 ；¥0.8 in / ¥2 out / 1M。快思考、低成本。( 腾讯云)
Doubao-Seed-2.0-lite — 字节 / 火山；参数未公开；¥0.6 in / ¥3.6 out / 1M。(GitHub)
Qwen3.5-122B-A10B — 阿里；122B 总参 / 10B 激活 ；$0.115 in / $0.917 out / 1M（中国内地 ≤128K 档）。( 阿里云)
GLM-4.6V — 智谱；参数未公开；¥1 in / ¥3 out / 1M（公开汇总）；偏视觉理解与多模态任务。(GitHub)
Hunyuan-a13b — 腾讯混元；13B；¥0.5 in / ¥2 out / 1M；最长输入 224K。是腾讯体系里很值得关注的小而强模型。(腾讯云)
Qwen3.5-27B — 阿里；27B；$0.086 in / $0.688 out / 1M（中国内地 ≤128K 档）。(阿里云)
GLM-4.7-FlashX — 智谱；参数未公开；$0.07 in / $0.40 out / 1M；200K。高性价比高速版。(Z.AI)
Doubao-Seed-2.0-mini — 字节 / 火山；参数未公开；¥0.2 in / ¥2 out / 1M。极低门槛的产品化模型。(volcengine.com)
Qwen3.5-35B-A3B — 阿里；35B 总参 / 3B 激活 ；$0.057 in / $0.459 out / 1M（中国内地 ≤128K 档）。( 阿里云)
GLM-Z1-FlashX — 智谱；参数未公开；¥0.1 in / ¥0.1 out / 1M（公开汇总）。更像极致低价入口。(GitHub)
Qwen3.5-Flash — 阿里；参数未公开 ；$0.029 in / $0.287 out / 1M（全球部署 ≤128K 档）。非常适合高并发客服、摘要、改写。( 阿里云)
GLM-4.7-Flash — 智谱；30B 级 ；免费；200K。如果你想先做 PoC，它是 2026 国内最值得先试的免费模型之一。( 智谱 AI)

读这个榜单时，最重要的 3 个结论

第一，2026 国内 API 已经明显分层了：
顶层是 Kimi K2.5、GLM-5、DeepSeek-V3.2、GLM-4.7、Qwen3-Max、MiniMax-M2.5 这批，适合做高价值 Agent、代码、复杂工作流。(Kimi)

第二，性价比最卷的是 DeepSeek / Step / Qwen 开源线 / GLM Flash 线。
DeepSeek 现在官方价仍然非常低；Step-3.5-Flash 把 196B 级模型压到很便宜；阿里 Qwen3.5 开源系和智谱 FlashX/Flash 则把“可用”门槛压得更低。(DeepSeek API Docs)

第三，如果你是做真正商用产品，别只看单价。
还要同时看：上下文长度、是否支持思考模式、工具调用、速率限制、缓存折扣、是否有免费 / 试用档。比如 Kimi、GLM、Qwen、DeepSeek 都在这些维度上差异很大。(Moonshot AI)

选型建议

做 AI 编码 / Agent：优先看 Kimi K2.5、GLM-5、GLM-4.7、MiniMax-M2.5、Step-3.5-Flash。(Kimi)

做 低成本 SaaS / 高并发机器人：优先看 DeepSeek-chat、Qwen3.5-Flash、GLM-4.7-FlashX、Doubao-Seed-2.0-mini、Hunyuan-TurboS。(DeepSeek API Docs)

做 企业级稳定接入 ：优先看 Qwen3-Max / Qwen3.5-Plus、腾讯 HY 2.0、豆包 2.0、GLM-4.7/5。( 阿里云)

做 先试再上量 ：优先试 GLM-4.7-Flash、GLM-4-Flash、GLM-4.5-Flash 这类免费模型。( 智谱 AI 开放文档)

读这个榜单时，最重要的 3 个结论

选型建议

数据科学编程群聊

网站安全认证