打开网易新闻 查看精彩图片

Input $1.25/M,Output $2.50/M,1M上下文窗口。这不是某家创业公司的低价引流,这是xAI刚全量放出的Grok 4.3。

4月30日太平洋时间,Grok 4.3正式开放API。比起上一代Grok 4.20,输入价格砍了约38%,输出价格砍了约58%。更关键的是——1M tokens上下文,比Claude Opus 4.7的200k大了5倍。

我是虾哥,不是程序员。搞了多年连锁零售信息化,我对"性价比"这事儿特别敏感。Grok 4.3这波,是真把API党当回事了。

核心结论:Grok 4.3不是"又一个大模型",而是API党降本增效的现成弹药。1M上下文+激进低价+Agentic能力,三个维度同时升级,适合长文档、Agent和语音场景快速上车。

❶ 五大升级,xAI这次动了真格

先说结论:这次不是挤牙膏,是五条线同时推。

升级维度

Grok 4.20时代

Grok 4.3现在

定价

$2.00 / $6.00

$1.25 / $2.50

上下文窗口

约200K

1M tokens

多模态

文本+图片

文本+图片+视频

文档生成

纯文本输出

原生PDF/XLSX/PPTX

语音API

无独立API

STT/TTS $4.20/M chars

数据来源:据xAI官方文档、aipricing.guru数据显示。定价单位为每百万tokens(美元)。

❷ 价格到底砍了多少?这是最关键的问题。对比Grok 4.20,输入从$2.00降到$1.25,降幅约37.5%;输出从$6.00降到$2.50,降幅约58.3%。如果你用的是Grok 4旗舰($3.00/$15.00),那降幅更夸张——综合降幅接近70%。

⚠️ 注意:超过200K tokens的请求,xAI会加倍收费。实际使用中建议控制在800K以内,留够推理空间。超长请求的端到端延迟可能超过30秒,生产环境建议异步处理。

打开网易新闻 查看精彩图片

❷ 1M上下文,不只是"能塞更多字"

1M tokens什么概念?大概能一次性塞进去一整本书、200页报告、或者一个中型项目的全部代码。这意味着很多场景下RAG可以省掉了——长上下文直接替代检索。

但也有代价。超过200K tokens按双倍价格计费,这意味着你得算清楚:是真需要1M,还是RAG+短上下文更划算。我的判断:文档分析、合同审查、长代码review这类场景,1M确实有用;普通问答和短对话,256K的Grok 4 Fast更省。

另一个隐藏信息:知识截止日期是2024年11月。比Claude Opus 4.7和GPT-5都老。如果你需要最新时事,得配合web_search工具补。

❸ Agent能力:这才是Grok 4.3的主场

据Artificial Analysis数据显示,Grok 4.3的Intelligence Index拿到53分,比同价位模型中位数34分高出一大截。

但更值得关注的是Agent维度:τ²-Bench电信客服准确率从93%提到98%,GDPval-AA Agent基准ELO从1179涨到1500。Vending-Bench长线仿真收益领先Claude Opus 4.7约1.26倍

关键判断:Grok 4.3的强项不在Coding(SWE-bench约73%,比Opus 4.7低14个百分点),而在Agentic——多步工具调用、长链规划、客服Agent,这些才是它的主场。

服务端工具调用也是亮点。Grok 4.3能自主决定何时调哪个工具——web_search、x_search、code_execution三个内置工具,模型自己串联,不用你在应用层写编排逻辑。

场景

Grok 4.3评级

长文档总结

⭐⭐⭐⭐⭐

1M窗口+高吞吐

Agent工作流

⭐⭐⭐⭐⭐

Vending-Bench领先

代码生成

⭐⭐⭐⭐

落后Opus 4.7,但价格补

语音场景

⭐⭐⭐⭐

比OpenAI便宜86-92%

能力维度

GPT-5.5

Claude Opus 4.7

Grok 4.3

Agent Planning

9.7

9.2

8.5

Tool Use / MCP

9.6

9.4

8.0

Coding(Agentic)

9.7

9.5

8.7

深度推理

9.2

9.8

8.8

长上下文

9.8

9.5

8.2

幻觉控制

8.8

9.5

7.8

写作/审美

9.0

9.8

8.2

响应速度

8.9

9.4

9.1

“自主执行感”

9.8

9.1

8.3

综合Agent指数

9.5

9.4

8.4

❹ 开发者实操:3分钟上手

❶ API接入模型名:grok-4.3 或 grok-4.3-latest 兼容OpenAI SDK,换base_url和model字段就行。 地区:us-east-1、eu-west-1。 快速测试走OpenRouter或Vercel AI Gateway也行。

❷ 核心参数Reasoning Effort三档:low(快)、medium(默认)、high(复杂任务)。 简单问答用low省token,复杂Agent用high。 Structured Outputs + Tool Calling原生支持,不用自己拼多步pipeline。

❸ 代码示例

# Grok 4.3 快速上手(OpenAI兼容)from openai import OpenAI client = OpenAI( api_key="你的xAI API Key", base_url="https://api.x.ai/v1" ) response = client.chat.completions.create( model="grok-4.3", messages=[ {"role": "user", "content": "帮我分析这份合同的风险点"} ], extra_body={"reasoning_effort": "high"} ) print(response.choices[0].message.content)

注意:reasoning_effort参数通过extra_body传入,不是OpenAI SDK的标准参数,但xAI API兼容支持。

❺ ⚠️ 8款老模型5月15日退役,迁移指南收好

这是很多人忽略的紧急事项。xAI官方5月6日发通知:8款旧模型将于5月15日PT时间12:00 PM退役(北京时间5月16日凌晨3:00)。退役后请求直接报错,不是降级,是硬停

退役模型

类型

迁移目标

grok-3

通用

grok-4.3

grok-4-0709

推理

grok-4.3

grok-4-fast-reasoning

推理

grok-4.3

grok-4-1-fast-reasoning

推理

grok-4.3

grok-code-fast-1

代码

grok-4.3

grok-4-fast-non-reasoning

快速

grok-4.20-non-reasoning

grok-4-1-fast-non-reasoning

快速

grok-4.20-non-reasoning

grok-imagine-image-pro

图片

grok-imagine-image

⚠️ 特别提醒:grok-code-fast-1是很多代码Agent项目的默认模型。如果你用的是Cursor类工具、IDE插件或CLI Agent,5月15日后必须切到grok-4.3,否则直接报错。迁移不是简单的搜索替换,记得重新测试提示词行为和工具调用稳定性。

❻ 语音API:比OpenAI便宜90%,这才是暗牌

很多人盯着语言模型降价,忽略了xAI同步推出的语音API

STT(语音转文字)和TTS(文字转语音),统一价格$4.20/百万字符。对比OpenAI Whisper约$30/百万字符,便宜86%;对比ElevenLabs约$50/百万字符,便宜92%

还有Voice Cloning:120秒参考音频就能克隆声音,生成的voice ID可以跨TTS和Voice Agent复用。客服机器人、播客生成、车载语音助手——xAI基本把语音AI的行业地板价打到了1/10。

我之前搞零售信息化的时候,客服系统是刚需。如果当时有这个价格,语音客服的部署成本能砍掉一大半。现在做AI工具的同学们,这是实打实的红利窗口。

❼ Colossus 2 + 7模型并训:xAI的算力野心

Elon Musk 4月8日在X平台披露:xAI的Colossus 2超算集群同时训练7个AI模型,参数规模从1T到10T不等,还额外推Imagine V2。

10T参数级模型——如果落地,就是Grok 5。据nextbigfuture分析,预计2026年中发布

这意味着什么?Grok 4.3不是终点,而是xAI算力基础设施的中间交付物。Colossus 2的并行训练能力才是底牌——7条线同时推,总有一条跑出来。

✅ 建议:编程工具党值得持续盯xAI。Grok 5的10T参数如果兑现,加上1M+上下文和更成熟的Agent工具链,2026下半年的API格局可能大变。

❽ 三个实操切入场景

❶ Voice Agent用新Voice API做客服/实时翻译,成本只有OpenAI的1/10。 120秒克隆声音+TTS复用,小团队也能做专业级语音产品。

❷ Coding Agent混合方案本地TUI(终端)跑轻量任务,Grok 4.3云端跑复杂推理。 "免费本地+低价云端"对比,这个选题本身就值得写一篇。

❸ 长文档/合规分析1M上下文+原生PDF输出,合同审查、报告生成一条龙。 零售行业的促销方案审核、供应商合同对比,都能直接上。

红虾点评:1. 性价比是最大杀手锏——xAI不玩虚的,直接把价格打下来,开发者真能用低价跑通复杂任务。 2. PR还是弱项——Elon团队悄咪咪放模型,OpenAI同级更新早上头条了。内容党从"被低估的Grok 4.3"切入,差异化明显。 3. 长期看好——Grok 5(10T参数级)已在路上,多模型并训+Colossus 2,基础设施野心不小。

关注亮虾哥

连锁零售IT老司机 | 非程序员用AI省80%时间

每天一篇AI干货,让AI替你打工

你现在用的是哪家API?5月15日前打算迁移吗?评论区聊聊

#AI工具 #Grok #大模型 #API #职场效率