后摩M50芯片发布:存算一体引爆端侧大模型AI革命

type
status
date
slug
summary
tags
category
icon
password
网址
人工智能(AI)浪潮席卷全球的今天,大模型(LLM)已成为技术竞赛的焦点。然而,当我们将目光从云端的超级计算中心移向身边的个人电脑、智能手机和物联网设备时,一个严峻的挑战浮出水面:如何在功耗和体积受限的端、边设备上,运行这些庞大的智能模型?这便是所谓的“算力最后一公里”难题。
时隔两年,后摩智能CEO吴强博士携其团队的最新力作——后摩漫界®M50,给出了一个极具说服力的答案。这不仅是一次产品的迭代,更是对“存算一体”技术路线的一次深度押注,旨在彻底颠覆端边AI计算的现有格局。作为AI门户网站,我们有必要深入解读这一可能改变游戏规则的技术突破。更多前沿AI新闻与深度分析,尽在 AIGC.Bar。

破局之道:什么是“存算一体”?

要理解M50芯片的革命性,首先必须弄懂其核心技术——存算一体(Compute-in-Memory, CIM)。
在经典的冯·诺依曼计算机架构中,计算单元(如CPU/GPU)和存储单元(如内存)是分离的。数据需要像货物一样,在“仓库”(存储)和“工厂”(计算)之间来回搬运。这个过程不仅耗时,消耗了宝贵的带宽,更产生了巨大的能耗,形成了制约性能的“存储墙”和“功耗墙”。
存算一体则是一种颠覆性的架构创新。顾名思义,它将计算功能直接融入到存储单元中,实现了“仓库即工厂”。数据在存储的位置就近完成计算,从根本上消除了数据搬运带来的延迟和功耗瓶颈。这对于需要处理海量参数的大模型应用而言,其优势不言而喻。后摩智能正是抓住了这一技术奇点,试图在巨头林立的AI芯片赛道中实现“弯道超车”。

硬核技术:M50芯片的三大创新

后摩漫界®M50之所以能实现160TOPS@INT8物理算力而典型功耗仅10W的惊人能效比,得益于其软硬件全栈自研的深度协同。
  • 第二代SRAM-CIM技术:M50采用的是真正的“存内计算”技术。后摩智能对SRAM存储阵列进行了深度结构性改造,实现了“双端口加载与计算并行”,即权重加载和矩阵计算可同时进行,效率倍增。同时,团队自主研发的测试和可靠性保障方案,成功解决了存算芯片的量产难题。
  • 天璇IPU架构与弹性计算:为了高效调度底层的存算单元,后摩自研了天璇(IPU)架构。其核心是“弹性计算”技术,可以根据权重数值的比特位(bit)进行超细粒度的计算优化。相比GPU只能跳过严格为“0”的权重,天璇架构可以对任意数值进行比特层面的优化,最高可带来160%的加速效果。更关键的是,它在业内首次实现了在存算架构上直接进行FP16浮点运算,让开发者可以直接运行开源的LLM,极大降低了适配门槛。
  • 后摩大道®编译器:再强大的硬件也需要高效的软件来释放潜能。与M50配套的“后摩大道®”编译器,能够将复杂的AI算子自动拆分、组合和优化,自动搜索最优执行策略。这让开发者从繁琐的手动“炼丹”中解放出来,聚焦于应用创新,加速了AI变现的进程。

生态布局:从芯片到产品的全面覆盖

一颗强大的芯片只是开始。为了让存算一体的澎湃算力触达千行百业,后摩智能基于M50芯片,构建了覆盖终端与边缘的完整产品矩阵。
  • 终端侧:推出了力擎™系列M.2卡,如同口香糖大小,可即插即用地为AI PC、机器人等设备提供强大的本地大模型推理能力,单卡即可流畅运行7B/8B模型。其被动散热设计对于噪音敏感的场景堪称福音。
  • 边缘侧:推出了力谋®系列加速卡及计算盒。通过集成多颗M50芯片,可为边缘服务器、智能安防、工业质检等场景提供高达640TOPS的算力,足以在本地支持70B甚至千亿参数的大模型,而功耗远低于同类产品。
这一系列产品,让离线、安全、低延迟的本地化人工智能应用成为现实,真正构建了一个“低功耗、高安全、好体验”的端边智能新生态。

战略定力:为何死磕“存算一体”

ChatGPTClaude等云端大模型风光无限的背景下,后摩智能为何选择“死磕”端边存算一体这条看似冷门的赛道?
首先,这是差异化竞争的必然选择。面对英伟达等巨头,初创公司唯有另辟蹊径,才能找到生存和发展的空间。
其次,这是技术发展的必然趋势。吴强认为,未来90%的数据将在端和边产生和处理。大模型要实现真正的普惠,就必须走出云端,解决端边设备的算力与功耗矛盾,而存算一体正是完美契合这一需求的答案。
最后,这是实现普惠AI的必经之路。让强大的AGI能力以极低的成本融入每一个设备,是后摩智能的初心,也是整个AI行业发展的终极目标。
M50的发布,是后摩智能交出的一份阶段性答卷,也为整个AI行业带来了新的想象空间。随着其下一代DRAM-PIM技术的推进,我们有理由相信,一个万物皆智能的时代正加速到来。想获取更多关于AI技术、Prompt工程和行业动态的AI日报,欢迎持续关注 AIGC.Bar。
Loading...

没有找到文章