AI算力浪费终结者:趋动科技软件定义GPU的效率革命
type
status
date
slug
summary
tags
category
icon
password
网址

告别低效:AI算力利用率的深层浪费
随着OpenAI将大模型推向大众市场,人工智能(AI)已从“能否实现”的探讨,迅速转变为“是否值得投入”的现实考量。AI技术正以前所未有的速度渗透到客服、营销、研发、办公等各个数字化场景,极大地提升了生产力。然而,在这股AI热潮的背后,一个严峻的问题也日益凸显:AI算力的巨大浪费。
表面上看,AI应用高昂的成本体现在Token费用上,深究下去,则是算力成本居高不下。但更深层次的原因,正如行业专家所指出,是“没有被有效组织起来的算力”。据甲子光年报道,AWS曾披露其GPU利用率约在10%-30%,而国内许多企业甚至低于15%,甚至不足10%。这意味着,大量昂贵的AI基础设施未能转化为相应的生产力,90%的投资处于闲置状态。一台价值数百万人民币的AI服务器,如果其核心部件GPU长期处于低负载运行,无疑是巨大的资源浪费。
在AI产业从“能用”迈向“用得起”的关键转折点,如何将这些“会流动的算力”高效利用,成为决定AI普及速度的核心。这正是趋动科技这家公司正在努力改写的篇章。更多前沿AI资讯与深度分析,敬请关注 AIGC.bar。
软件定义GPU:重塑智算中心的效率基石
回顾算力产业的发展历程,无论是CPU虚拟化催生云计算时代,还是如今GPU虚拟化开启智算新纪元,其本质都是“软件重新定义硬件”的故事。趋动科技正是抓住了这一历史性的结构转折点。他们认为,当AI从实验室走向千行百业,决定其最终普及速度的,不再是谁的模型更聪明,而是谁能把算力的成本降到足够低、供给做到足够稳。
趋动科技的解决方案核心在于“软件定义GPU”,其理念与二十多年前VMware对CPU进行虚拟化的方式异曲同工。VMware通过将一台物理服务器虚拟成多台,把企业数据中心的CPU利用率从10%提升至60%-70%,从而催生了云计算时代。如今,趋动科技正试图在GPU领域复制这一成功,将“独占GPU”转变为“共享算力池”。
在趋动科技的方案中,用户感知到的仍是“专属GPU”,但底层运行的已不再是固定的物理GPU,而是一个由软件统一调度的资源池。当用户不使用时,虚拟卡不占用真实资源;任务启动时,系统会即时分配可用算力。这使得GPU从必须提前买断的硬件资产,转变为可动态领取、即时兑付的资源单元。这种变革不仅显著提升了GPU利用率,也极大降低了AI部署的边际成本,让AI技术真正变得“用得起”。了解更多AI行业动态,请访问 AIGC.bar。
趋动科技的三大核心技术护城河
实现GPU的“软件定义”并非易事,尤其是在英伟达CUDA生态高度封闭的背景下。趋动科技历经十年磨砺,投入巨大工程心血,支持了CUDA生态中超过30000个API,覆盖了从9.0到13.1的每一个版本,并建立了超600万条测试用例库,确保了产品的极致稳定性与兼容性。其GPU利用率平均提升约4倍,部分客户甚至达到10倍。支撑这一成就的,是趋动科技的三大核心技术能力:
远程调用:实现算力“超卖”的基石
传统的GPU虚拟化多停留在“切分”层面,即把一张卡切给不同用户。而趋动科技的远程调用技术,则解决了算力“超卖”的关键问题。通过让用户的应用能够跨网络、跨服务器调用任意一张GPU,且用户完全无感知,趋动科技将GPU算力池从单台服务器扩展到整个数据中心。池子越大,超卖失败的概率越低,从而最大限度地消除了时间维度和空间维度的算力浪费。尽管初期远程调用性能损失高达97%,但经过持续优化,趋动科技已将其降至不到3%,即便在跨城域网络下也能正常工作。
显存复用:一张卡跑多个模型的秘密
在大模型推理场景中,显存往往是比计算单元更稀缺的资源。趋动科技通过显存复用技术,利用虚拟化层对GPU显存访问的全局可见性,自动识别并消除重复的模型权重数据。这意味着,原本只能运行一个模型的GPU,现在可以同时运行多个相同模型的实例,大幅降低显存占用,从而倍增GPU算力利用率。
模型快速切换:时间维度的效率极限
当不同用户运行不同模型时,显存复用不再适用。此时,模型快速切换成为解决时间维度算力浪费的唯一途径。趋动科技能够在用户任务不中断的前提下,将任务从一张GPU无缝切换到另一张GPU,或在同一GPU上实现不同模型的快速“存盘”与“调盘”。整个过程对用户透明,极大地提升了GPU在不同任务间的流转效率。这不仅是调度问题,更是对GPU资源、任务状态和用户体验联合掌控能力的极致考验。
AI芯片的“安卓操作系统”:打造AI时代的“卖铲人”
趋动科技的产品OrionX,通过创建虚拟化的GPU资源池,将物理GPU与AI应用解耦,实现算力与显存的动态分配、回收,并支持远程访问。这使得GPU资源可以在数据中心的任何位置被调用,如同本地资源一般。其控制层面集成了高级调度策略、热迁移、弹性扩缩容等功能,为企业级数据中心提供了高效、灵活的管理能力。
趋动科技不仅提供软件解决方案,还通过自有算力出租、合作售卖等形式参与算力租赁,并能实现远高于行业平均水平的毛利率,这表明他们已成功将算力转化为可自由流通的“生产要素”。王鲲将趋动科技的产品定位为“英伟达和国产GPU的操作系统”,更长远的目标是成为“AI芯片的安卓操作系统”。
在AI算力产业这个万亿级的市场中,趋动科技扮演着“卖铲人”的角色。他们通过提升用户生产效率的方式,间接“抽税”,提供“省钱”之外的“确定性”——稳定、安全、兼容异构芯片、支持私有化部署、长期在线运转。这对于金融、运营商、能源电力等对稳定性要求极高的客户而言,是不可或缺的软件底座。
随着算力资源池化被写入国家“十五五”规划,趋动科技作为参与国家标准制定的企业,其未来发展空间巨大。从不足15%的GPU利用率,到平均提升数倍甚至十倍,趋动科技不仅解决了AI产业的巨大浪费,更在构建一个高效、普惠的智算新纪元。欲了解更多AI前沿技术与行业资讯,请持续关注 AIGC.bar,获取最新的AI新闻、AI门户、AGI、LLM、大模型、Prompt、AI变现等精彩内容。
Loading...
.png?table=collection&id=cbe6506e-1263-8358-a4d7-07ce62fcbb3f&t=cbe6506e-1263-8358-a4d7-07ce62fcbb3f)