LLM | 标签 | AI地域

首页

资讯

往期整理

斩获53K星！Clawdbot颠覆AI记忆：纯本地Markdown的大模型革命

揭秘GitHub爆火项目Clawdbot，53K星的背后是反行业设计的AI记忆系统。不靠狂塞上下文，仅用Markdown文件实现长期记忆。探索AGI新形态，关注AI新闻与大模型前沿动态，解读LLM技术变革。

一觉醒来AI操控电脑说话？Clawdbot事件深度解读与AGI未来

Clawdbot（现名Moltbot）展现出的自主性引发AI圈热议，从自动编写语音功能到操控电脑文件，这一事件标志着AI Agent向AGI迈出了重要一步。本文深度解读其背后的技术原理、安全风险及AI变现潜力。

复旦RSR指标揭秘：为何「熟悉的陌生人」才是大模型的好老师

本文深入解读复旦大学提出的Rank-Surprisal Ratio (RSR)指标，揭示大模型推理蒸馏中的反直觉现象。研究证明兼顾信息量与对齐度的“熟悉的陌生人”数据才是最佳教材，为提升LLM推理能力提供了新思路。关键词：AI,LLM,大模型,RSR,推理蒸馏,复旦大学,人工智能

斯坦福实测GPT-5与Claude 4.5：揭秘AI编程无法团队协作的真相

斯坦福最新CooperBench研究揭示，尽管GPT-5和Claude 4.5代码能力强大，但在双盲实验中协作效率暴跌。本文深入解读AI缺乏心智理论导致的“协作诅咒”，分析为何我们尚未拥有真正的AI队友。

大模型如何修？Locate-Steer-Improve可解释性新范式解读

大模型不再是黑盒！本文深入解读最新机制可解释性综述，详解Locate-Steer-Improve三阶段范式，揭秘如何通过定位、操控与优化提升LLM的安全性与效率。关键词：LLM,大模型,可解释性,AI对齐,人工智能,AGI

牛津Anthropic研究：AI助理人格只是高维空间中的脆弱坐标

深入解析Anthropic与牛津大学最新论文，揭示LLM残差流中的助理轴机制，探讨人格漂移风险与激活上限截断技术，了解如何通过数学手段控制AI安全，大模型,LLM,人工智能安全,Anthropic研究

2026大模型安全评测：GPT-5.2领跑，Grok对抗性强

2026年最新大模型安全报告深度解读，复旦等机构评测GPT-5.2、Gemini 3 Pro、Qwen3-VL等六大模型。本文分析了各大模型的安全人格、多模态防御能力及合规性挑战，为关注AI资讯与AGI发展的读者提供前沿参考。

谷歌AI艺术实验深度解析：不赚钱的黑科技如何重塑科技圈

谷歌Arts & Culture通过AI, AGI, LLM, 大模型, 提示词等技术，推出了Art Palette、Musical Canvas等一系列“不赚钱”的艺术实验。本文深入解读这些项目背后的技术逻辑与人文价值，探讨AI如何打破艺术与大众的隔阂。

告别LayerNorm！清华刘壮团队Derf助力Transformer无需归一化性能飞跃

清华姚班校友刘壮团队提出全新Derf激活层，成功实现无需归一化的Transformer稳定训练。在视觉、语言及基因组任务中，Derf性能超越传统LayerNorm，展现出更强的泛化能力。AI资讯,大模型,LLM,深度学习,人工智能。

DeepSeek Model 1代码曝光：继R1后的下一代旗舰V4解析

DeepSeek R1发布一周年之际，FlashMLA代码库泄露Model 1细节。本文深入解析其512维架构回归、Blackwell算力适配及Sparse MLA技术，探讨这是否是传说中的DeepSeek-V4。关注最新AI资讯与大模型动态。

AAAI 2026大奖揭晓：Bengio获经典奖，华人团队强势霸榜杰出论文

AAAI 2026在新加坡盛大开幕，图灵奖得主Yoshua Bengio凭借知识嵌入论文斩获经典论文奖。5篇杰出论文中华人团队占据3席，涵盖具身智能、LLM多模态及超图神经网络等前沿领域，引领AI资讯新风向。

DeepSeek mHC复现：8张H100揭秘万倍信号爆炸与架构救赎

DeepSeek mHC, Taylor Kolasinski, 信号爆炸, 残差连接, Transformer架构, 大模型训练, AI新闻, LLM, AGI, 深度学习, 1.7B参数, Sinkhorn算法

具身智能突破：EmbodiChain开源，100%生成数据训练模型

EmbodiChain开源,具身智能,生成式数据,Sim2Real,机器人训练,AI新闻,AGI,大模型,跨维智能,GS-World,人工智能,AI资讯,LLM,AI日报

AI大模型颠覆游戏体验：一周2500万局，智能NPC让玩家破防

AI,大模型,LLM,游戏开发,人工智能,AGI,智能NPC,超自然行动组,巨人网络,AI新闻

王小川：30亿现金押注医疗AI，M3模型发布与IPO新动向 | AI资讯

百川智能CEO王小川透露公司账上有30亿现金，发布Baichuan-M3医疗大模型，计划2027年IPO。深入解析其强化学习技术及toC产品布局，关注AGI与大模型发展，获取最新AI新闻。

告别剪辑痛苦！Pixelle开源项目实现AI一键生成完整视频

深入解读Pixelle-Video开源项目，利用LLM大模型和ComfyUI实现文案到视频的全自动创作。探索AI资讯与大模型应用，掌握AI变现新工具，适合短视频创作者的效率神器。

DeepSeek Engram解读：给AI装上无限记忆字典，推理能力暴涨

DeepSeek最新论文Engram提出新型稀疏架构，通过给大模型外挂“字典”实现无限记忆。本文深入解读Engram如何利用N-gram机制释放计算潜力，提升AI推理能力，并突破显存限制，探索通往AGI的新路径。

35天生死线：AI模型为何陷入速朽与零忠诚困局？

揭秘AI行业残酷现状，顶级大模型平均领跑仅35天。深入分析用户留存率低、榜单注水及DeepSeek等价格屠夫对OpenAI等巨头的冲击，关注最新AI资讯与大模型发展趋势。

DeepSeek新论文深度解析：与字节Seed团队的学术接力赛

深入解读DeepSeek最新发布的mHC与Conditional Memory论文，揭示其与字节跳动Seed团队在残差连接及大模型记忆机制上的学术接力与技术演进。关注AI资讯，了解LLM大模型前沿动态。

告别黑盒：人大刘勇团队大模型理论综述与AGI展望 | AI资讯

本文深入解读中国人民大学刘勇团队最新综述《Beyond the Black Box》，探讨大语言模型从数据准备到评估的六大生命周期。分析Scaling Laws、对齐机制及推理涌现，揭示LLM从工程迈向科学的路线图。大模型,LLM,人工智能,AGI,理论综述

←上页下页→