AI Agent 协作新范式:Paperboy 探索人机协作的未来

type
status
date
slug
summary
tags
category
icon
password
网址
notion image
🚥本周,十字路口的嘉宾是 Paperboy 团队(https://www.paperboy.com[1])。John Yang 21 岁,CEO。Jett Chen 19 岁,CMU 大一在读,同时是 founding engineer。Paperboy 团队 12 人,10 位工程师,融资 470 万美金。
John 认为:人类和 AI Agent 配合工作的最佳方式,很可能还没被发明出来。虽然已经有了 Claude Code、Codex、Manus、OpenClaw,但它们本质上都是 session-based + prompt-based。用户需要打开一个窗口,输入 prompt,等完成,关掉。下次从零开始。
Paperboy 正在尝试找到一种更自然、更连续、更可协作的 Agent 界面与记忆结构——Agent 应该通过观察你用电脑来自己学习,用 IM 而不是 session 来组织对话,主动找你,而不是等你 prompt。
如果你在做 AI 产品、AI infra、或正在思考 Agent 如何进入团队工作流,希望这期内容会给你启发。
快问快答
👦🏻 Koji
我们还是从十字路口的传统,快问快答开始,请问二位的年龄?
🧑🏻‍💻 John Yang
21。
👨🏻‍💻 Jett Chen
19。
👦🏻 Koji
毕业院校是?
🧑🏻‍💻 John Yang
没毕业,之前在 Pratt Institute 读建筑。
👨🏻‍💻 Jett Chen
我高中毕业于上海星河湾双语学校,现在在 CMU 读大一,刚刚结束。
👦🏻 Koji
你们的 MBTI 和星座是什么?
🧑🏻‍💻 John Yang
ISTJ,双子座。
👨🏻‍💻 Jett Chen
INTJ,处女座。
👦🏻 Koji
创业之前,你们做了些什么?
🧑🏻‍💻 John Yang
Paperboy 是我的第二家公司。我的第一家公司叫 Million,我们在 React Ecosystem 里做了很多开源的 Dev Tools,后来做了一个产品叫 Same.Dev,能让普通人通过输入一个 URL,就做出和任何网站一模一样的 UI。
Million 是在 YC Winter 24 中的。
👨🏻‍💻 Jett Chen
在 Paperboy 之前我是个高中生,喜欢做开源项目和打 CTF。我做了一个叫 EarthKit 的东西,可以基于一张照片,用多模态技术推测出它的拍摄地点,效果比传统的纯神经网络模型更好。
👦🏻 Koji
那是什么时候做的?
👨🏻‍💻 Jett Chen
差不多一两年前。
起点:现在的 AI 产品,我用着不爽
👦🏻 Koji
我们来介绍一下,Paperboy 是一个什么样的产品?
🧑🏻‍💻 John Yang
Paperboy 是一家刚刚起步的公司,使命是探索我和 AI 协作的最佳方式。
去年,在我做完 Same 和用过 Manus 之后,我对市面上的 AI 产品总有一些不爽。Paperboy 就是从我尝试各种方法,不断摸索不同路径开始的。我们试图解决一些技术问题,也包括产品形态的问题。
比如,我不应该需要把自己的文件、Email 和所有个人信息都丢到一个聊天框里。如果我要和别人协作,同时跟一个 Agent 对话,应该有一种非常简单的方式,让我们在同一个上下文窗口里完成。
再比如,Agent 在知道我的很多信息后,应该能主动地提前帮我做一些事情,但现在的聊天窗口完全做不到。而且,现在所有的产品都是基于会话的,session 一多,你就找不到之前聊天的上下文了。
这些问题,总体上是模型能力和实际应用之间的差距。我觉得在产品体验上,依然有巨大的探索和创新机会,所以我们公司叫“Paperboy Products”,是产品、是复数。
👦🏻 Koji
我们稍后展开聊。先完成快问快答,你们的融资情况如何?
🧑🏻‍💻 John Yang
25年我们融了470万。
👦🏻 Koji
Cool。收入和利润呢?产品还没发布对吧?
🧑🏻‍💻 John Yang
毛利为零甚至是负的,我们每天都在亏钱哈哈哈。
👦🏻 Koji
大家大概什么时候能用上产品?
🧑🏻‍💻 John Yang
我们已经把一个能从操作系统活动中学习的 Agent 原型发给了一些朋友。
但它成本太高了,而且运行得不太好。我们正在努力这个月内完成下一代产品,然后会再次推向市场。
👦🏻 Koji
我们发布这期播客时,会把链接放在下面,感兴趣的朋友可以去 sign up for waitlist。
🧑🏻‍💻 John Yang
Yeah,我想当这期播客发布时,大家应该就能看到了。
👦🏻 Koji
好的,目前团队规模是?
🧑🏻‍💻 John Yang
12 个全职员工,其中 10 位是工程师。
👦🏻 Koji
我第一次见 John 的时候,你给我看了一份给团队内部开会用的文档,第一句话就是:“人类与 AI 协作的最佳方式,很可能还没有被发明出来。”
写下这句话时你看到了什么?到现在,你的看法有变化吗?
🧑🏻‍💻 John Yang
对,那是我们第一次全体会议时我准备的文档。当时公司只有我、杜哥、Chen、Jett 四个人。
我们从一个核心理念出发:与 AI 协作的最佳方式尚未被发明,而我们有机会成为找到那个答案的团队。Cursor 最早开始努力寻找与 AI 编程的最佳方式,并且取得了巨大的成功,他们是第一家真正专注在这个目标上的公司,也证明了抢先一步是多么重要。
你问我从那时到现在有什么新的感悟。我觉得很酷的一点是,这其实是一个不断移动的目标。
你永远无法真正达到市场的期望,只能不断变得更好。因为每当你做出新东西,其他人都会看到。如果别的团队有品味,用户有品味,他们就能发现新的痛点,痛点永远存在,所以你唯一能做的就是持续改进。
这是一个不断移动的目标。自从 OpenClaw 和 Anthropic 的 Claude Cowork 发布以来,这个感觉更强烈了。
👦🏻 Koji
最近很多创始人感到有些绝望,因为创业过程中不断有“王炸”出现。你们公司成立的这半年,也恰好是行业剧烈变化的半年,从 Claude Code 到 OpenClaw,再到 Hermes。
你的感受是什么?你最初想做的东西,和现在在做的,有没有因为这些巨头的出现而发生剧烈改变?
Claude Code 轰炸之下
🧑🏻‍💻 John Yang
其实没有。我认为问题的探索空间源自于人。
从技术和产品的角度看,问题可以分为三类:
第一,技术上,要让 Agent 能够真正从用户的环境中学习。它必须融入用户已有的工作流,也就是数据产生的地方,比如电脑上的文件和各种软件。
第二,它必须是个性化的。个性化意味着你不需要频繁地提示它,可以信任它处理更复杂、更重要的任务和决策。这也意味着它要更可靠,能在更长的时间周期里持续运行。
第三,设计上,它的体验必须极其直观,用户不需要像学一个新工具那样去学习它。如果你的 Agent 足够主动,能自己提出新想法,那么用什么形态来承载这些主动的产出呢?它需要在一个完整的环境中,需要个性化,并且能和你现有的团队很好地协作。
所以,当你审视市面上的新工具时,会发现并没有出现什么新的维度。这三个维度的发展,仍然受限于人类团队本身。
Agent 的两大问题
Cursor 和 Manus 是目前最成功的 agent 形态,但 John 说它们有两个根本性的问题——这直接定义了 Paperboy 要做的事。
👦🏻 Koji
可以简单向大家推荐一下 Paperboy 吗?听我们播客的很多人可能已经是 Claude Code、Manus 或其他 Agent 的重度用户了,为什么他们要给 Paperboy 一个机会?
🧑🏻‍💻 John Yang
目前,Claude Code 和 Manus 是最成功的 Agent 形式,但它们是基于会话的(session-based),也是一对一、基于prompt的。
这带来了两个重要问题。首先,session-based 意味着在它们的侧边栏里,你有多个工作区(项目),每个项目下又有一堆会话。每次想让模型做点新事,就得开启一个新会话。
其次,你与模型的交互方式是,你输入提示词,然后等待,再发一条消息,它再回复。
这种方式的问题在于:
第一,Agent 是被动的。你必须描述得非常具体。你可以创建技能文档(比如 agent.md)来告诉它该做什么,但你得主动维护它,而且很难把你的品味、判断和做事方式,完整地转化为纯文本。
第二,会话是不连续的。拥有几百个甚至几千个会话是件很糟糕的事。我知道在过去的某些会话里,上下文窗口中包含了非常有价值的见解,但如果我当时没有刻意保存下来,那这些信息就永远丢失了。
Paperboy 正面解决了这两个问题。
第一,Agent 必须通过观察你如何使用电脑来自己学习。这包括你的屏幕截图、键盘敲击、鼠标移动、会议音视频、浏览记录、iMessage 等等——当然,前提是你授权 Paperboy 访问这些信息。
第二,交互应该存在于持续的聊天流中,拥有比单个上下文窗口长得多的历史记录,并且可以被搜索。标准的产品形态应该像 iMessage 或微信,你有一堆聊天,点进去就可以和里面的参与者继续对话。
👨🏻‍💻 Jett Chen
Loading...

没有找到文章