AI发展再临十字路口:Scaling Law红利见顶后的多模态底层突围之路
type
status
date
slug
summary
tags
category
icon
password
网址

在经历了长达三年的“烈火烹油”式爆发增长后,人工智能行业似乎正在进入一个微妙的冷静期。曾经被奉为圭臬的“Scaling Law”(尺度定律)——即单纯通过堆砌算力和数据就能无限提升模型能力的信念,正在遭遇现实的挑战。近日,在“模型智未来·2025商汤科技AI论坛”上,商汤科技联合创始人、首席科学家林达华发表了题为《从能力涌现到价值闭环,多模态大模型价值与创新之路》的演讲,直言AI行业再次站在了关键的“十字路口”。
本文将深入解读林达华的演讲核心,探讨在Scaling红利即将耗尽的当下,AI技术如何通过底层创新突破瓶颈,以及多模态大模型如何从实验室走向真正的价值闭环。对于关注AI资讯、AGI发展以及大模型未来的读者来说,这是一份不可多得的深度分析。
告别暴力美学:Scaling Law遭遇天花板
回顾过去三年,从ChatGPT的横空出世到GPT-4的震撼登场,全球科技界见证了AI史上演进最快的时期。彼时,业界普遍迷信“大力出奇迹”,认为只要GPU足够多、数据规模足够大,通往AGI的道路就是坦途。
然而,进入2024年后,这种单纯依赖预训练Scaling的路径开始显现疲态。林达华指出,虽然OpenAI o1和DeepSeek R1通过长思维链(Chain of Thought)、强化学习和Test-Time Scaling等“后训练”范式的变革,暂时突破了推理能力的瓶颈,但OpenAI前首席科学家Ilya Sutskever等先驱已发出警告:无论是预训练还是后训练,单纯依赖算力扩张的Scaling路径终将面临边际效应递减的挑战。
行业陷入了短暂的迷茫:当参数竞赛不再是万能药,AI的下一步该往哪里走?林达华给出了两条清晰的路径:
1. 向外走: 摆脱单纯的榜单刷分,深入垂直行业,以实际价值驱动技术落地。
2. 向内求: 回归实验室,探索下一次技术范式的原始创新,打破现有的架构局限。
价值闭环:从“秀肌肉”到“真落地”
AI技术的发展已经到了一个临界点:它不再仅仅是科技巨头在AI新闻中炫耀的Demo,而是具备了深入替代人类高价值工作的能力。林达华总结了三个标志性趋势,昭示着AI正在进入价值落地的爆发期:
- 进化速度垂直上升: 现在的AI突破人类极限的速度越来越快。从早期的图像识别到如今解决国际奥赛级别的数学题,AI的能力迭代周期正在急剧缩短。
- 处理复杂任务能力质变: AI不再局限于秒级识别任务,而是能够胜任深度搜索、撰写长篇调研报告等原本需要人类耗时数小时甚至半天的工作。
- 推理成本指数级下降: 随着模型优化和硬件进步,达到实用水平的AI模型推理成本在过去两年下降了近280倍。
这意味着,AI已经准备好从“尝鲜”走向“深耕”。对于企业而言,未来的竞争不再是谁的模型参数更大,而是谁能利用AI工具(如Prompt工程、LLM应用)实现降本增效。正如麦肯锡报告预测,到2025年,企业对AI的采用率将高达88%。
商汤提出的“用户价值牵引AI迭代”模式值得借鉴:通过强化学习(RL)构建闭环,将用户的每一次反馈转化为奖励信号,驱动模型不断优化。例如在AI PPT生成场景中,不再依赖昂贵的全过程数据,而是利用人类对结果的快速评判来训练奖励模型,从而让AI生成的PPT不仅“形似”更能“神似”。
多模态底层重构:打破视觉与语言的隔阂
在多模态领域,当前的大模型架构普遍存在一个致命缺陷:视觉感知与语言推理是割裂的。林达华犀利地指出,目前主流的多模态模型本质上是“视觉编码器 + 语言模型”的浅层拼接。
这种架构导致模型缺乏真正的视觉理解能力。例如,许多先进模型在数手指、判断物体三维结构等看似简单的问题上频频翻车。它们并没有真正“看懂”图片,而是基于识别到的物体标签进行语言层面的概率推理。如果将这样的模型装入机器人,在真实的三维物理世界中运行,后果不堪设想。
为了解决这一根本性问题,商汤推出了开源的NEO架构。这是一种原生的多模态架构,不再是简单的模块拼接,而是让每个计算层、每个神经元都具备内生的多模态处理能力。
- 内生多模态能力: 仅用1/10的数据量,就能达到同量级主流模型的水平。
- 空间思维培养: 引入跨视角预测(Cross-View Prediction)等创新训练范式,超越了传统的Next Token Prediction,让模型真正具备三维空间理解能力。
测试数据显示,NEO架构在空间智能的表现上甚至超过了GPT-5级别的模型以及李飞飞团队发布的专用模型。这标志着AI正在从单纯的语言模型向真正的世界模型演进。
结语:原始创新是破局关键
AI行业正处在一个新旧交替的十字路口。旧有的Scaling Law红利正在消退,而新的范式尚未完全确立。林达华的演讲为我们揭示了一个明确的方向:未来的AI竞争,将是底层架构创新与应用价值闭环的双重比拼。
无论是想要了解最新的人工智能动态,还是寻找AI变现的机会,我们都必须认识到,简单的“拿来主义”已经行不通了。唯有回归技术本源,探索如NEO架构般的原始创新,才能在下一轮AGI浪潮中立于不败之地。
对于广大开发者和AI爱好者来说,关注像aigc.bar这样的AI门户,及时获取最新的AI日报和深度解读,将有助于在瞬息万变的技术洪流中保持敏锐的洞察力。让我们共同期待,在底层创新的驱动下,AI能真正走出实验室,赋能千行百业。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)