英伟达CUDA 13.1史诗级更新!Tile编程重塑AI算力开发格局
NVIDIA发布CUDA 13.1,被称为20年来最大更新。引入CUDA Tile编程模型、Green Contexts及Blackwell架构深度支持,彻底改变AI大模型与LLM的算力开发模式。关注AI资讯与AGI发展,了解算力底座的最新进化。
Fast-dLLM v2:大模型推理提速2.5倍,开启AI效率新纪元 | AI新闻
深入解读Fast-dLLM v2,一种将自回归大模型(LLM)低成本适配为并行解码模型的新技术。通过少量微调,实现端到端吞吐量2.5倍提升,同时保持生成质量,探索AI推理效率新篇章。
AI桌面超算新玩法:NVIDIA+Mac Studio,推理提速近3倍
探索AI大模型推理新突破,NVIDIA DGX Spark与苹果Mac Studio强强联合,通过PD分离与流式传输技术,实现LLM推理速度飙升277%,解锁桌面级超算新可能。
没有找到文章
英伟达CUDA 13.1史诗级更新!Tile编程重塑AI算力开发格局
NVIDIA发布CUDA 13.1,被称为20年来最大更新。引入CUDA Tile编程模型、Green Contexts及Blackwell架构深度支持,彻底改变AI大模型与LLM的算力开发模式。关注AI资讯与AGI发展,了解算力底座的最新进化。