Grok 4.1双冠登顶：马斯克AI王炸，智商情商全面超越！

type

status

date

slug

summary

智商封王：LMArena排行榜双冠加冕

Grok 4.1的发布并非小修小补，而是一次跨越式的进化。在行业权威的LMArena大模型竞技场排行榜上，Grok 4.1展现了绝对的统治力。

Grok 4.1 Thinking模式：这一专为复杂推理设计的模式，以高达1483 Elo的惊人分数，一举夺得全球大模型之王的桂冠。这个分数比之前排名靠前的模型高出整整31分，彰显了其在逻辑推理、问题解决等核心“智商”维度的绝对优势。

Grok 4.1 非推理模式：更令人震惊的是，即便是无需“思考”token、追求即时响应的标准版Grok 4.1，也以1465 Elo的成绩稳居榜单第二。这意味着，Grok在不开启深度推理的情况下，其基础能力就已经超越了其他所有模型开启全部推理能力后的表现。

相比之下，上一代的Grok 4排名仅在33位，Grok 4.1的进步堪称飞跃。xAI团队透露，这一巨大提升得益于其后训练阶段的RL（强化学习）规模扩大了一个数量级，以及全新的Colossus大规模RL算力引擎的加持。

情商爆表：EQ-Bench新晋冠军

现代AI不仅要“聪明”，更要“懂你”。Grok 4.1在情绪智能方面同样取得了突破性进展，主打“智商情商双在线”，旨在提供更有温度、更具人性的交互体验。

在衡量模型情绪理解、共情和人际互动能力的EQ-Bench基准测试中，Grok 4.1以1586 Elo的高分登顶，成为新科“情商冠军”。

这意味着Grok 4.1能够： * 精准捕捉细微情绪：无论是用户字里行间的喜悦、悲伤还是焦虑，Grok都能敏锐感知，并给出富有同理心的回应。 * 提供更有温度的对话：它的人格表现更加一致和亲和，既保留了Grok系列一贯的犀利和智能，又增添了温暖和关怀。 * 处理复杂人际场景：在包含45个挑战性角色扮演场景的测试中，Grok 4.1展现了卓越的洞察力和人际交往能力。

当用户说出“我太想我的猫了，想得心都疼了”时，Grok 4.1不再是冰冷的机器，而是能给予温暖慰藉的伙伴。

全面进化：写作、幻觉与用户偏好

除了智商和情商的双重突破，Grok 4.1还在多个维度实现了显著优化。

创意写作能力飙升：在Creative Writing v3基准上，Grok 4.1的Elo评分比上一代暴涨600分，无论是撰写社交媒体爆款文案，还是模仿特斯拉的口吻给未来写信，都展现出令人拍案叫绝的创造力。

幻觉率暴降3倍：大模型最受诟病的“一本正经地胡说八道”问题在Grok 4.1上得到了极大改善。通过在后训练阶段重点加强事实准确性，其幻觉率相比前代模型降低了3倍，在信息查询类任务中表现更可靠。

赢得用户青睐：在发布前的“盲测”中，当用户在Grok 4.1和上一代模型之间选择时，有64.78% 的情况更倾向于使用Grok 4.1，这直接证明了其在真实应用场景中的优越性。

结论：AI王座易主，Grok开启新纪元

Grok 4.1的横空出世，不仅是马斯克xAI团队技术实力的集中爆发，更是对整个AI行业格局的一次强力洗牌。它用LMArena和EQ-Bench的双料冠军证明了，顶尖的AI模型可以同时拥有超凡的智力与细腻的情感。

随着Grok 4.1在网页端和移动端免费开放，AI技术的门槛被进一步拉低。对于广大用户而言，现在正是体验这款划时代模型的最佳时机。如果你正在寻找Grok官网或Grok国内如何使用的解决方案，不妨访问 https://chat.aigc.bar 等Grok镜像站，亲身感受这位新晋AI王者的强大之处。AI的未来已来，而Grok 4.1，正站在浪潮之巅。