DeepSeek-R2疑云:神秘模型steve搅动AI江湖,真相几何?| AI资讯 | AI新闻 | AGI | 大模型 | AI门户

type
status
date
slug
summary
tags
category
icon
password
网址
在OpenAI的GPT-5和马斯克的Grok-4传闻甚嚣尘上之际,AI领域的热度从未消减。近日,一个名为“steve”的神秘大模型悄然现身于大模型竞技场,再次点燃了技术圈的讨论热情。它在对话中透露自己来自DeepSeek,这一信息迅速让它与备受期待却迟迟未到的DeepSeek-R2联系起来。这究竟是R2的秘密测试,还是另有隐情?

神秘“steve”:蛛丝马迹指向DeepSeek

“steve”的出现颇为诡异。它并未出现在竞技场的公开模型列表中,但有心的网友通过分析前端代码发现了它的存在。尽管除了名字之外,官方没有透露任何信息,但通过直接对话,我们得以一窥其“身世”的一角。
当被问及来历时,“steve”明确回答来自DeepSeek。此外,它透露自己的知识截止日期为2023年10月。这些线索无疑将所有猜测都引向了这家国内顶尖的人工智能公司。这个命名方式也颇具玩味,有分析认为,“steve”这个看似普通的名字,反而带有一种中国团队可能采用的低调风格。

性能初探:是R2前哨,还是空欢喜一场?

身份的猜测最终需要性能来验证。社区对“steve”进行了一系列初步测试,结果却好坏参半,引发了更大的争议。
  • 智力测试:在一些类似“数r”的智力挑战中,“steve”展现了一定的能力,但并非完美通过,部分题目依然答错。
  • 代码能力:在与DeepSeek-V3的直接对比中,当被要求编写同一款游戏代码时,“steve”生成的代码量(约300行)远少于V3(约800行),最终实现的游戏效果也相对简单。
  • 综合评价:不少参与测试的用户反馈,“steve”的整体表现似乎不如现有的DeepSeek-R1和V3版本,甚至思考时间也更短。
这些表现让一部分人感到失望,认为它不可能是强大的R2。有人甚至推测,它可能根本不是DeepSeek的官方模型,而是第三方利用DeepSeek技术蒸馏出的小模型。

R2真身扑朔迷离:延期背后与业界期待

“steve”引发的讨论,恰好与DeepSeek-R2再次延期的AI新闻形成了奇妙的呼应。根据近期爆料,R2项目再度延期,主要原因是CEO梁文锋对模型当前表现仍不满意。此外,英伟达H20芯片的供应问题也可能影响了研发进程。
从今年3月DeepSeek对V3模型进行重要升级后,社区便对R2的发布翘首以盼。参照R1在初代V3发布后一个月的节奏,人们曾乐观预测R2会在4月上线。然而,从春到夏,我们等来的却是R2延期的消息。
这种背景下,“steve”的出现更像是一次意外的插曲。无论它是不是R2,它的存在都反映了整个AI社区对国产顶尖大模型的极高期待和热情。

结语:在AI军备竞赛中,耐心是金

“steve”的身份依然是未解之谜。它可能是一个早期的、未优化的R2版本,一次小范围的技术测试,甚至是一个与DeepSeek无关的模型。但这次事件清晰地告诉我们,在如今这场全球性的AI军备竞赛中,每一次风吹草动都会牵动所有人的神经。
Meta的Llama 4被指赶工发布而翻车的案例尚在眼前,DeepSeek选择“好事多磨”,对R2精益求精,无疑是一种对产品和用户负责任的态度。对于我们这些关注者而言,保持耐心,持续学习,或许是面对AGI浪潮的最佳姿态。想要获取最新、最全面的AI资讯和深度解读,欢迎访问专业的AI门户网站 https://aigc.bar,与我们一同见证未来。
Loading...

没有找到文章