Grok 4 登场：强大性能与争议并存 – 我的生活随拍图片分享

当地时间 7 月 9 日，马斯克旗下的 xAI 正式发布了下一代大模型 Grok 4 系列，一时间在科技界引发了广泛关注。

马斯克在发布会上自信宣称，Grok 4 是当下世界上最聪明的 AI，其在所有学科上的表现都超越了博士水平。大模型性能评估平台 Artificial Analysis 的测试结果似乎也为其说法提供了支撑，Grok 4 以 73 分的总成绩领先于 o3、Gemini 2.5 Pro 等一众知名模型，成为当前的领先 AI 模型。

Grok 4 系列包含 Grok 4 和 Grok 4 Heavy 两个版本，均为推理模型。其中，Grok 4 Heavy 作为多智能体版本，可调用大规模计算资源，能完成更复杂的任务。在 “人类终极考试”（HLE）中，Grok 4 Heavy 表现尤为突出，不使用工具时就能取得较高分数，使用工具后成绩更是达到 44.4%，几乎是 Gemini 2.5 Pro 的两倍。此外，在 GPQA 测试、AIME25 数学竞赛题以及 ARC – AGI 通用人工智能测试中，Grok 4 系列也都有着亮眼的表现。

不过，如此强大的 Grok 4，其订阅费用也相当高昂。Grok 4 的订阅年费为 300 美元，而 Grok 4 Heavy 的 SuperGrok Heavy 套餐年费更是高达 3000 美元，约合人民币 21530 元。即便价格不菲，马斯克对 Grok 4 的期望远不止于商业盈利，他还计划用 Grok 4 重写人类知识库，纠正其中的错误并补充缺失内容，再基于新的知识库重新训练 AI。

然而，这一宏大计划却遭到了业界的质疑。Cohere 联合创始人尼克・弗罗斯特指出，马斯克可能在打造一个反映其个人信念的模型，这会使模型对不认同其信念的用户缺乏吸引力。谷歌 DeepMind 研究副总裁奥里奥尔・文亚尔斯则从技术角度分析，认为剔除训练数据中的所有错误，可能导致模型失去检测和修复新错误的能力。此外，Grok 3 直播前夕曾因传播不当言论被批评，也让外界对 Grok 4 的安全性有所担忧，担心其难以摆脱 “高性能之下的高风险”。

尽管 Grok 4 饱受争议，但资本市场却对其背后的 xAI 公司充满信心。被称为 “木头姐” 的凯西・伍德表示，Grok 虽起步晚，但凭借合理的训练集群布局，性能已快速追赶上头部模型。xAI 在 Grok 4 发布前一周刚完成百亿美元融资，累计融资额现已超 200 亿美元，充足的资金为其算力布局提供了保障。凯西・伍德还认为，AI 基础模型市场规模巨大，xAI 借助星链等渠道具有分发优势，有望在该领域脱颖而出。

目前，xAI 已计划后续发布代码模型、多模态智能体以及视频生成模型。未来，Grok 4 能否如马斯克所期望的那样重塑人类知识库，xAI 又能否在竞争激烈的 AI 市场中占据一席之地，让我们拭目以待。

为您推荐

全国十大美味葡萄，你尝过几种？

白露养生三宝：错过再等一年的应季美味

柑橘溃疡病防治新利器：春雷·喹啉铜

橘子树落果难题？五大原因及解决办法大揭秘

香辣浓郁洋葱黑椒牛肉片：美味与健康的完美融合

秋日鸽汤：气血双补的东方食养智慧