
当地时间 7 月 9 日,马斯克旗下的 xAI 正式发布了下一代大模型 Grok 4 系列,一时间在科技界引发了广泛关注。
马斯克在发布会上自信宣称,Grok 4 是当下世界上最聪明的 AI,其在所有学科上的表现都超越了博士水平。大模型性能评估平台 Artificial Analysis 的测试结果似乎也为其说法提供了支撑,Grok 4 以 73 分的总成绩领先于 o3、Gemini 2.5 Pro 等一众知名模型,成为当前的领先 AI 模型。
Grok 4 系列包含 Grok 4 和 Grok 4 Heavy 两个版本,均为推理模型。其中,Grok 4 Heavy 作为多智能体版本,可调用大规模计算资源,能完成更复杂的任务。在 “人类终极考试”(HLE)中,Grok 4 Heavy 表现尤为突出,不使用工具时就能取得较高分数,使用工具后成绩更是达到 44.4%,几乎是 Gemini 2.5 Pro 的两倍。此外,在 GPQA 测试、AIME25 数学竞赛题以及 ARC – AGI 通用人工智能测试中,Grok 4 系列也都有着亮眼的表现。
不过,如此强大的 Grok 4,其订阅费用也相当高昂。Grok 4 的订阅年费为 300 美元,而 Grok 4 Heavy 的 SuperGrok Heavy 套餐年费更是高达 3000 美元,约合人民币 21530 元。即便价格不菲,马斯克对 Grok 4 的期望远不止于商业盈利,他还计划用 Grok 4 重写人类知识库,纠正其中的错误并补充缺失内容,再基于新的知识库重新训练 AI。
然而,这一宏大计划却遭到了业界的质疑。Cohere 联合创始人尼克・弗罗斯特指出,马斯克可能在打造一个反映其个人信念的模型,这会使模型对不认同其信念的用户缺乏吸引力。谷歌 DeepMind 研究副总裁奥里奥尔・文亚尔斯则从技术角度分析,认为剔除训练数据中的所有错误,可能导致模型失去检测和修复新错误的能力。此外,Grok 3 直播前夕曾因传播不当言论被批评,也让外界对 Grok 4 的安全性有所担忧,担心其难以摆脱 “高性能之下的高风险”。
尽管 Grok 4 饱受争议,但资本市场却对其背后的 xAI 公司充满信心。被称为 “木头姐” 的凯西・伍德表示,Grok 虽起步晚,但凭借合理的训练集群布局,性能已快速追赶上头部模型。xAI 在 Grok 4 发布前一周刚完成百亿美元融资,累计融资额现已超 200 亿美元,充足的资金为其算力布局提供了保障。凯西・伍德还认为,AI 基础模型市场规模巨大,xAI 借助星链等渠道具有分发优势,有望在该领域脱颖而出。
目前,xAI 已计划后续发布代码模型、多模态智能体以及视频生成模型。未来,Grok 4 能否如马斯克所期望的那样重塑人类知识库,xAI 又能否在竞争激烈的 AI 市场中占据一席之地,让我们拭目以待。