1050万美元种子轮！一张照片变数字人，AI视频交互新时代

type

status

date

slug

summary

引言：从内容生成到实时交互的跨越

2024年下半年，Sora的惊艳亮相让全球见识到了AI生成视频的震撼力。然而，当行业还在惊叹于视频画质的逼真度时，AI视频的下一个进化节点已经悄然到来。近日，初创公司 Lemon Slice 宣布获得由 Matrix Partners 和 Y Combinator 领投的 1050 万美元种子轮融资。

与Sora专注于“生产视频内容”不同，Lemon Slice 的核心逻辑在于“交互”。它能够仅凭一张静态照片，就生成一个可以实时对话、具备情感反馈的数字人物。这一突破标志着视频正从单纯的媒介载体，演变为具备感知与反馈能力的 Video Agent（视频智能体）。了解更多前沿趋势，欢迎访问 AI门户。

AI Agent的进化：从“文本对话”到“视觉共鸣”

在过去的发展阶段，人工智能 代理主要以文本或语音为媒介。虽然这种方式在信息传递上效率极高，但在建立用户信任和情感粘性方面却显得力不从心。根据 Gartner 的预测，到2030年，约80%的企业应用将具备多模态能力。

Lemon Slice 的出现正是顺应了这一趋势。在教育辅导、心理咨询和客户服务等对“人味儿”要求极高的场景中，纯文本的冷冰冰无法替代视觉上的表情互动。通过将 LLM 的大脑与实时生成的视频形象相结合，AI 不再是一个对话框，而是一个“看得见、摸得着”的数字伙伴。这种形式的转变，是 AGI 走向大众化应用的关键一步。

核心技术突破：一张照片即可驱动的数字分身

Lemon Slice 的技术魅力在于其极低的门槛。用户只需上传一张写实或卡通风格的照片，系统即可赋予其“生命”。

Video Agents（视频智能体）：面向企业端，开发者可以通过 API 将数字人嵌入到官网或 App 中。这意味着未来的客服不再是预设的文字回复，而是一个能根据业务逻辑进行实时讲解、引导的视频角色。

Creative Studio（创意工作室）：面向个人创作者。只需图片和一段音频，即可快速生成高质量的数字人视频，极大降低了 AI变现 的技术壁垒。

多角色互动：Lemon Slice 支持多个 AI 角色在同一场景中面对面聊天。这一功能为短视频创作、虚拟剧场等场景提供了无限的想象空间。

Lemon Slice-2：追求极致的“能效比”

在 大模型 领域，参数量往往被视为实力的象征，但 Lemon Slice 走了一条差异化路线。其自研的 Lemon Slice-2 视频扩散转换器模型规模为 200 亿参数。虽然规模不及顶尖通用模型，但其核心优势在于“实时性”。

通过自回归架构优化，该模型能够在单块 GPU 上实现每秒 20 帧（20fps）的实时生成速度。这种高效的推理能力，是实现“视频聊天”而非“视频生成”的技术底座。对于想要深入研究 提示词 优化和模型部署的开发者来说，这种高能效比的架构极具参考价值。

商业化前景：订阅制驱动的多元应用

Lemon Slice 目前采取了分层订阅模式，从每月 8 美元的入门版到 240 美元的企业版，覆盖了从个人爱好者到大型企业的全频谱需求。

这种定价策略反映了其产品的高度通用性。无论是作为 AI日报 中提到的企业培训助手，还是作为社交平台上的虚拟博主，Lemon Slice 都在尝试将视频交互变成一种“随取随用”的标准能力。随着 openai 和 chatGPT 等生态的不断完善，这种基于视频的交互界面有望成为下一代互联网的标配入口。

结论：视频交互将是AI应用的下一片蓝海

Lemon Slice 创始人 Lina Colucci 指出，未来的所有视频都将是互动式的，并根据观看者的需求进行个性化定制。

从“看视频”到“聊视频”，这不仅是交互形式的改变，更是人类与机器沟通深度的跃迁。虽然目前这一技术在真实感和逻辑连贯性上仍有提升空间，但其展示的 AI资讯 趋势已经非常明确：交互本身正在成为核心竞争力。

在这个 AI 技术日新月异的时代，保持对前沿动态的关注至关重要。想要获取更多关于 claude、Prompt 及 人工智能 的最新深度解析，请持续关注 aigc.bar，掌握 AGI 时代的每一个风口。