字节跳动Lumine:原神AI代练诞生,游戏Agent迈向AGI新纪元
type
status
date
slug
summary
tags
category
icon
password
网址

“原神,启动!”——这句玩家间的戏言,如今被一个特殊的“旅行者”变成了现实。最近,字节跳动发布了一款名为 Lumine 的AI智能体(Agent),它能够在《原神》这款大型3D开放世界游戏中自主“畅玩”,从跑图开荒到完成长达数小时的主线任务,其表现堪比一名熟练的人类玩家。这不仅是游戏领域的一大突破,更预示着通用人工智能(AGI)的发展迈入了一个激动人心的新阶段。
Lumine的出现,标志着AI不再仅仅是执行预设脚本的NPC,而是真正具备感知、推理和行动能力的“智能玩家”。这一进展让我们不禁思考:当AI能够在复杂虚拟世界中自主学习和决策时,距离它们进入现实世界、成为具身智能还有多远?所有最新的AI新闻和深度分析,你都可以在AI门户网站 AIGC.bar 上找到。
Lumine是如何成为“提瓦特高手”的?
Lumine之所以能像真人一样玩《原神》,其背后是一套复杂而精妙的技术架构。它并非简单地识别图像并点击,而是真正“理解”游戏世界并做出决策。其核心技术可以概括为以下三大机制:
- 专为3D世界设计的感知与交互:Lumine基于Qwen2-VL-7B-Base模型构建,继承了强大的多模态理解能力。它通过处理720P的游戏画面帧,并结合历史操作记录,构建了一个完整的“感知空间”,从而能够像人类一样理解游戏内的动态环境。
- 创新的混合思考策略(Hybrid Thinking):为了平衡效率与智能,Lumine采用了一种独特的思考模式。在面对常规操作(如跑图、重复攻击)时,它会直接输出动作,以保证流畅性;而在遇到关键节点(如Boss战策略调整、解谜思路卡壳)时,则会启动“内心独白”式的推理过程,进行深思熟虑的规划。这种设计极大地提升了AI在长周期任务中的决策效率和成功率。
3. 统一语言空间建模操作:Lumine将所有键盘和鼠标操作(如移动、跳跃、技能释放、菜单点击)都统一建模为语言序列。通过一个三阶段的训练流程,让模型从零开始逐步掌握从基础操作到复杂任务规划的能力:
* 第一阶段(预训练):混合游戏操作数据和网页数据,让模型掌握基础的视觉-运动能力。
* 第二阶段(指令跟随):通过大量指令-动作数据对的训练,让模型能够理解并执行人类的自然语言指令。
* 第三阶段(决策推理):利用人工标注的推理数据,训练模型自主规划、反思和修正,使其能够在无人干预的情况下完成长达数小时的复杂任务。
这一系列创新,使得Lumine的端到端延迟降低至130毫秒以内,实现了真正意义上的实时交互,为流畅的游戏体验提供了技术保障。
不止于《原神》:Lumine的惊人泛化能力
Lumine的强大之处不仅在于精通《原神》,更在于其惊人的跨游戏泛化能力。研究团队在多款不同类型和画风的游戏中对Lumine进行了测试,结果令人印象深刻。
- 《鸣潮》:作为与《原神》玩法相似的开放世界游戏,Lumine几乎无缝迁移,在102分钟内100%完成了前100分钟的主线剧情,证明了其对同类玩法的快速适配能力。
- 《崩坏·星穹铁道》:面对玩法差异巨大的回合制游戏,Lumine依然是唯一能完整通关第一章主线的模型,虽然耗时较长(7.2小时),但92.3%的完成率展示了其理解不同游戏机制的潜力。
- 《黑神话·悟空》:在高难度、写实画风的3A大作中,Lumine也成功完成了新手教程和部分主线,完成率达到85.7%。尽管在识别写实画风的动态特征上偶有失误,但其在Boss战中流畅的躲避动作,已经展现出成为高难游戏AI代练的雏形。
这些测试结果表明,Lumine并非一个只能玩《原神》的“专才”,而是一个具备通用游戏能力的“通才”。它通过在虚拟世界中的学习,掌握了解决问题的通用逻辑,这是通往AGI道路上的关键一步。
从游戏到现实:通用Agent的终极试验场
Lumine的成功并非孤例。谷歌DeepMind也在积极探索游戏Agent,其最新推出的SIMA 2同样能够在多种虚拟游戏中遵循复杂指令。无论是字节跳动还是谷歌,科技巨头们都将大型3D游戏视为构建具身AGI的理想“试验场”。
为什么游戏如此重要?因为像《原神》这样的开放世界游戏,提供了一个复杂、动态且安全的虚拟环境。AI可以在这里:
* 学习物理规则:理解重力、碰撞、流体等基本物理概念。
* 掌握复杂交互:与成百上千种物体和NPC互动,学习因果关系。
* 锻炼长期规划:为了完成一个长远目标(如主线任务),需要进行一系列的短期决策和路径规划。
* 低成本试错:在虚拟世界中失败的成本几乎为零,AI可以不断尝试、学习和改进。
这些在游戏中习得的能力,最终都有望迁移到现实世界。今天在提瓦特大陆上自由探索的Lumine,或许就是未来在工厂、家庭和城市中为我们服务的机器人智能体的雏形。
结论
字节跳动Lumine的发布,不仅仅是为《原神》玩家提供了一个“超级代练”的想象,更是AI发展史上的一个重要里程碑。它展示了通过在复杂虚拟环境中进行大规模训练,AI可以涌现出惊人的自主学习、推理和泛化能力。
从游戏Agent到具身智能,这条发展路径正变得前所未有的清晰。随着技术的不断迭代,我们有理由相信,像Lumine这样的通用AI智能体,终将从虚拟走向现实,深刻地改变我们的世界。想要持续关注AI领域的最新动态和前沿资讯,欢迎访问AI门户网站 AIGC.bar,获取最全面的AI新闻和深度解读。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)