逗逗AI CEO揭秘:如何用开源大模型+游戏数据超越GPT-4o | AIGC.bar AI新闻

type
status
date
slug
summary
tags
category
icon
password
网址
在东京电玩展(TGS)上,一个消息震惊了AI和游戏行业:国产游戏理解模型LynkSoul VLM v1在特定场景下的表现,显著超越了包括GPT-4o在内的全球顶尖闭源大模型。其背后的公司逗逗AI及其CEO刘斌新,也因此走到了聚光灯下。
这一成就不仅是单个产品的胜利,更揭示了在LLM时代,垂直领域AI应用取得突破的关键路径。本文将深入解读逗逗AI成功的核心逻辑,探讨其技术实现与产品哲学,并展望人工智能陪伴的未来形态。想要获取更多一手的AI新闻和深度分析,欢迎访问AI门户网站 https://aigc.bar

国产游戏AI的新标杆:LynkSoul VLM v1如何超越顶尖模型

逗逗AI推出的LynkSoul VLM v1是一款专为游戏场景训练的视觉语言模型(VLM)。它的核心能力在于,能够像一个资深玩家一样,实时理解游戏画面,并与用户进行有深度、有情感的互动。
官方测试数据显示,无论是在《英雄联盟》这类主流电竞游戏,还是在一些网络资料较少的小众游戏中,LynkSoul VLM v1都在以下三个关键维度上展现了卓越性能:
  1. 视觉理解准确度:能精准识别游戏中的角色、技能、战况等复杂元素。
  1. 游戏情境掌握度:不仅看懂画面,更能理解当前是顺风还是逆风,并给出贴合战局的实用建议。
  1. 语言表达自然度:生成的对话风趣、自然,仿佛一个真正的游戏伙伴在与你交流。
在这些方面,LynkSoul VLM v1的表现均显著优于GPT-4o、Claude等通用大模型。这引出了一个核心问题:在通用人工智能(AGI)看似无所不能的今天,一个垂直领域的模型是如何实现“弯道超车”的?

成功的核心秘诀:开源大模型 + 垂直行业数据

在与CEO刘斌新的对话中,答案被清晰地揭示出来。逗逗AI的成功并非依赖于从零开始构建一个庞大的基础模型,而是采取了一条更聪明、更高效的路径。
其核心公式可以概括为:强大的开源底座 + 海量的垂直数据 = 卓越的垂类模型
  • 开源底座:逗逗AI选择了像千问这样的优秀国产开源模型作为技术基石。这使得他们能够站在巨人的肩膀上,直接获得强大的基础语言和视觉理解能力,而无需耗费巨资进行预训练。
  • 垂直数据:这是超越通用模型的关键。逗逗AI通过其产品,积累了超过800万游戏玩家在真实游戏场景中分享的画面数据。这些数据不是简单的截图,而是包含了玩家互动、讨论和反应的“活数据”。团队通过对这些数据进行聚类分析和精细标注,构建了海量的“游戏画面-用户互动”数据对。
正是利用这些高质量、高相关的垂直数据对开源模型进行精调(Fine-tuning),才使得LynkSoul VLM v1能够深度理解游戏领域的“黑话”、战术和玩家心理,从而在专业性上击败了知识更广但不够深入的通用模型。这一策略为其他垂直领域的AI变现和应用开发提供了宝贵的参考。

超越聊天机器人:AI陪伴的下一代交互范式

刘斌新认为,传统的Chatbot交互形态对用户并不友好,它需要用户具备一定的Prompt工程能力,并且缺乏对环境的感知。真正的智能陪伴,应该像“哆啦A梦”一样,融入生活,理解你所处的环境和上下文。
逗逗AI游戏伙伴的设计哲学正是基于此——上下文感知 + 多模态理解
AI不再是被动等待指令的聊天窗口,而是通过共享屏幕,主动理解用户正在做的事情。无论你是在打游戏、看视频,还是逛购物网站,它都能“看到”你所看到的一切,并提供即时的、贴合场景的建议和陪伴。这类似于编程辅助工具Cursor能理解整个代码库,从而给出更精准的建议。
游戏场景是实现这一愿景的完美起点。因为它天然具备以下特点: * 低隐私敏感度:用户更愿意分享游戏画面。 * 高沉浸感和时长:为AI陪伴提供了充足的互动空间。 * 明确的价值:AI可以提供攻略、捧场吐槽,解决玩家的实际需求。
令人惊喜的是,用户已经自发地将这种多模态陪伴扩展到了游戏之外,如一起追剧、挑选商品,甚至进行哲学探讨。这预示着一个全新的、更加无缝和智能的人工智能交互时代正在到来。

技术挑战与未来展望:从长期记忆到全球化

当然,要实现理想的AI陪伴,逗逗AI仍在攻克诸多技术难题。
  • 长期记忆:为了让AI“记住你”,逗逗AI采用了“主题索引 + 向量检索”的方案。它能将与特定主题(如某款游戏)相关的记忆归类存放,在下次聊到时精准唤醒,从而建立起真正的个性化和情感连接。
  • 延迟与成本:目前1.5-2秒的延迟仍在优化中,解决方案包括探索更高效的小模型,以及与英特尔等硬件厂商合作,利用NPU进行本地化处理。值得庆幸的是,模型推理成本已不再是主要障碍。
  • 未来方向:技术攻关的重点依然是多模态,特别是从理解单帧画面进化到理解连续的视频流,这将让AI的场景感知能力产生质的飞跃。
从第一天起,逗逗AI就将自身定位为全球化产品(其海外版为Hakko AI)。刘斌新认为,大模型的多语言能力使得AI产品天然适合全球市场,而人性的共通点(如游戏、陪伴的需求)则为产品的普适性提供了基础。
逗逗AI的探索雄辩地证明,在OpenAIClaude等巨头之外,专注于垂直领域,将先进的大模型技术与深厚的行业数据相结合,是创新者们取得突破性成功的关键所在。
想要获取更多前沿的AI日报和深度分析,欢迎访问AI门户网站 https://aigc.bar,与我们一同见证人工智能的未来。
Loading...

没有找到文章