Meta限用Claude Code防蒸馏风险,附Claude国内使用指南
type
status
date
slug
summary
tags
category
icon
password
网址
AI 编程工具越强,Meta 这样的巨头反而越尴尬。
据外媒 The Information 报道:Meta 正在限制员工在 AI 模型构建中使用 Claude Code 和 Codex,原因是担心涉及模型蒸馏。
Meta 担心这些外部模型生成的内容,可能进入自家的训练数据或评测体系,从而引发所谓的模型蒸馏争议。
地址:https://www.theinformation.com/articles/internal-docs-show-meta-putting-limits-claude-codex-fearing-distillation
模型蒸馏,成了 Meta 担心的边界
简单来说,模型蒸馏指的是基于一个模型的输出,去训练或改进另一个模型。对于 AI 公司而言,这是一条非常敏感的边界。因为 OpenAI、Anthropic 和 Google 等公司的服务条款,都明确禁止用户使用模型输出来构建竞争性系统。
Meta 面临的麻烦恰恰在这里。
今年早些时候,Meta 成立了应用 AI 工程团队,任务之一是改进自家的编程助手 MetaCode。为了提升 MetaCode 的能力,这个团队需要构建高质量数据集、设计编程挑战题,并用这些任务来训练和测试代码模型。
但问题是,Meta 又是 Claude Code 的大客户之一。工程师在日常开发中使用 Claude Code 和 Codex 并不稀奇,可一旦这些工具生成的代码、测试题、bug 分析、任务思路进入 MetaCode 的研发流程,事情就会变得复杂。
The Information 查阅到的内部指南显示,Meta 已经对应用 AI 工程团队使用外部 AI 工具划下明确限制。公司允许工程师在某些常规工作中使用 AI,例如搭建工作流、整理代码和文件、构建测试基础设施等。但即便在这些场景下,AI 生成内容也必须经过人工仔细审查。
更关键的是,指南明确禁止工程师使用外部 AI 模型生成用于测试自家模型的编程挑战题。Meta 在内部文件中表示,这类做法会让工程师失去对任务设计的主导权,公司不希望任务来自模型。
此外,Meta 还限制工程师使用 AI 分析源代码来查找漏洞,或基于代码分析生成测试任务创意。换句话说,外部 AI 可以参与一些辅助性工程工作,但不能帮助 Meta 决定应该测试什么问题,更不能成为 MetaCode 训练和评测任务的来源。
内部文件还提到,如果正在被测试的内部模型能够访问某些基础设施容器,那么任何 AI 生成内容都不能被放入这些容器中。基础设施容器通常包含应用运行所需的代码、库和相关环境。Meta 担心,第三方模型输出如果被内部模型接触到,后续可能间接进入训练链路。
据报道,一份 Meta 内部备忘录甚至要求团队暂停部分使用 Claude Code 和 Codex 的任务。原因在于,Meta 担心外部模型的输出可能流入自家训练数据。一旦被模型厂商认定存在蒸馏风险,会引发合作层面的问题,可能被撤销模型访问权限,甚至遭到账号或公司级封禁。
越来越贵的 AI 账单
这背后也有成本压力。
随着 Meta 在全公司范围内推广 AI 工具,内部 AI 使用成本正在快速上升。Meta 今年仅内部 AI 使用支出就可能达到数十亿美元。此前,Meta 还曾鼓励员工积极使用 AI 工具提升效率,但随着 token 消耗不断增加,公司已经开始限制员工的 token 使用量。
因此,减少对外部 AI 编程工具的依赖,把更多开发工作迁移到 MetaCode 上,正变得越来越重要。可 Meta 想要用自家工具替代 Claude Code 和 Codex,又必须先确保这个替代工具没有吸收 Claude Code 和 Codex 的输出。
这就形成了一种微妙的矛盾:Meta 需要外部 AI 工具提升研发效率,同时又要防止这些工具的贡献进入自家模型体系。
也就是说,科技公司可以使用竞争对手的 AI 模型来辅助研发,但必须证明这些模型的输出没有进入自己的训练数据、评测集和模型构建流程。
Meta 发言人表示,公司制定了清晰政策,规定团队如何使用 AI 工具,确保员工能够以负责任的方式专注于高影响力工作。
AI Coding 的问题,已经不只是提效
但这件事真正值得关注的地方在于,它揭开了 AI Coding 时代的新问题。
过去,AI 编程工具主要被视为提效工具:帮工程师写代码、补测试、整理文件、修复 bug。现在,随着 Claude Code、Codex 这类工具能力增强,它们已经开始影响更上游的研发环节,包括任务设计、评测构造、代码分析和模型训练流程。
当 AI 工具生成的不只是代码,还包括测试标准、问题设计和工程思路,企业就很难再轻松回答一个问题:自家模型的能力,究竟来自内部工程师,还是来自外部模型的输出?
Meta 对 Claude Code 和 Codex 的限制,表面上是一次内部合规调整,背后则指向一个更大的行业变化:AI 编程工具正在从开发辅助工具,变成模型研发供应链的一部分。
公司越依赖前沿模型来搭建内部 AI 基础设施,就越难证明这些智能能力究竟来自哪里。
文章来自于微信公众号 “机器之心”,作者 “机器之心”
Loading...
.png?table=collection&id=cbe6506e-1263-8358-a4d7-07ce62fcbb3f&t=cbe6506e-1263-8358-a4d7-07ce62fcbb3f)