vLLM商业化Inferact融资1.5亿,清华学霸联创引领AI新基建
type
status
date
slug
summary
tags
category
icon
password
网址

在大模型(LLM)狂飙突进的时代,除了模型本身的参数竞赛,如何高效、低成本地运行这些庞然大物成为了行业的新痛点。近日,开源大模型推理加速框架 vLLM 的核心团队正式官宣创业,成立名为 Inferact 的新公司,并在种子轮融资中惊人地筹集了 1.5 亿美元(约合 10 亿元人民币),公司估值直逼 8 亿美元。
这一消息不仅震动了创投圈,更标志着 AI 行业重心正在从单纯的“模型训练”向“模型推理”转移。作为全球领先的 AI资讯 和 AI新闻 聚合平台,AINEWS 将为您深入解读这家独角兽雏形的诞生背景、核心技术优势以及清华特奖得主游凯超在其中的关键角色。
融资规模破纪录:资本押注AI推理赛道
Inferact 的成立之所以备受瞩目,首先在于其惊人的融资规模。本轮 1.5 亿美元的融资由顶级风投 Andreessen Horowitz(a16z)和 Lightspeed 领投,Sequoia Capital(红杉资本)等知名机构跟投。
虽然这一金额不及 Ilya Sutskever 创立 SSI 时的 10 亿美元,但已经超过了欧洲 AI 新贵 Mistral AI 的 1.15 亿美元种子轮融资。这在 人工智能 基础设施领域,堪称史无前例。资本的疯狂涌入,释放了一个明确的信号:业界普遍认为,AI 行业未来面临的最大挑战已不再是构建新模型,而是如何以低成本、高可靠性地运行现有模型。随着 AGI 进程的加速,推理成本的控制将决定 AI 应用能否大规模普及。
从伯克利实验室到商业化:vLLM的生态壁垒
Inferact 的核心资产是开源项目 vLLM。这个诞生于加州大学伯克利分校天空计算实验室(Sky Computing Lab)的项目,自 2023 年启动以来,迅速成为了大模型推理领域的“工业标准”。
目前,vLLM 已经支持了超过 500 种模型架构,可在 200 多种加速器上运行。无论是 Meta、谷歌这样的科技巨头,还是 Character.AI 这样的独角兽,其底层推理能力都离不开 vLLM 的支持。作为一个由全球 2000 多名贡献者共同构建的开源生态系统,vLLM 解决了 GPU 显存利用率低和推理速度慢的核心痛点。
Inferact 的成立,旨在将这一开源项目的优势商业化。公司首席执行官、vLLM 创始维护者之一 Simon Mo 明确表示,Inferact 的使命是通过降低推理成本、加快推理速度来加速 AI 的发展。这对于希望通过 AI变现 的企业来说,是至关重要的基础设施支持。
算力危机预警:推理将耗尽所有新增容量
在宣布融资的同时,Simon Mo 对全球 AI 算力紧缺的现状提出了深刻见解。他预测:“当前用于大模型训练的 AI 集群,将在六个月内完全被用于推理……推理会逐渐消耗掉所有算力容量,并耗尽所有新增的容量。”
这一观点揭示了 LLM 发展的必然趋势。随着用户量的增加和模型应用场景的丰富,推理(Inference)对算力的需求将呈指数级增长,甚至超过训练(Training)阶段。Inferact 正是定位于模型和硬件的交汇点:
* 当模型厂商发布新架构时,Inferact 确保 vLLM 提供首日支持;
* 当硬件厂商开发新芯片时,Inferact 负责与 vLLM 集成;
* 当企业进行大规模部署时,Inferact 提供稳定高效的运行环境。
清华特奖得主游凯超:核心技术力量的加盟
值得中国 AI 社区特别关注的是,Inferact 的联合创始人名单中出现了一位熟悉的名字——游凯超(Kaichao You)。
游凯超是清华大学的博士生,曾获得清华大学特等奖学金(清华学子的最高荣誉之一)。作为 vLLM 项目的核心贡献者,他的加入为 Inferact 注入了强大的技术基因。创始团队还包括 Woosuk Kwon、Roger Wang、Joseph Gonzalez 和 Ion Stoica 等学界和业界大牛。这种“顶尖高校实验室 + 开源社区领袖”的配置,让人联想到 Apache Spark 和 Ray 等成功项目的商业化路径,也预示着 Inferact 在 大模型 底层技术上的深厚潜力。
展望:构建AI时代的“操作系统”
Inferact 的首要任务非常明确:继续支持 vLLM 作为独立的开源项目,并将改进成果回馈社区。同时,他们将开发独立的商业产品,帮助企业在不同类型的硬件上更高效地运行 AI 模型。
在 人工智能 快速迭代的今天,Inferact 实际上正在构建 AI 时代的“操作系统”内核。它向下屏蔽了不同硬件的差异,向上为各种大模型提供统一的高效运行环境。对于开发者和企业而言,这意味着更低的门槛和更高的效率。
随着 ChatGPT、Claude 等应用的普及,以及 Prompt 工程的日益成熟,底层的推理效率将直接决定上层应用的体验。Inferact 的出现,或许正是 AI 产业从“尝鲜”走向“大规模生产”的关键拼图。
想要了解更多关于 AI 基础设施、大模型 动态以及前沿 AI资讯,请持续关注 AINEWS,我们为您提供最及时、最专业的 AI日报 和深度分析,助您在 AI 浪潮中把握先机。
Loading...
.png?table=collection&id=1e16e373-c263-81c6-a9df-000bd9c77bef&t=1e16e373-c263-81c6-a9df-000bd9c77bef)