Anthropic 把测量方式从七天快照换成每天连续采样,给每次对话的产出物打 30 多类标签,再叠加一份近 9700 人的问卷。两个最反直觉的发现,都不在「AI 提升了多少效率」这条老线上。
一年前,绝大多数人用 Claude 还是一问一答。随着 Claude Code 和 Cowork 起量,会话越来越多变成长时间运行的 agentic 任务,聊天记录已经装不下「人到底在用 AI 干什么」。
这一版经济指数做了三处改动,让镜头更清楚:采样频率提高,能把使用模式看到小时级别(过去依赖的是七天快照);新增一个分类器,给每次对话的产出物打标签;数据拆得更细,把聊天和 Cowork 对话与第一方 API 的结果分开、按月汇总。
还有一处更大的补充。过去 Anthropic 缺一个会话之外的视角:人怎么看 AI 改变自己的工作和眼前的机会,用 AI 的方式是否会塑造预期,理想中又想从 AI 那里得到什么。这一版第一次用一份问卷直接去问,并把答案用隐私保护的方式关联回真实使用数据。
这份报告分三章:节律(人在什么时间用)、产出物(用 AI 做出了什么)、感受(人怎么看 AI 对自己工作的影响)。下面按这三条主线走。
新的连续采样让一个朴素的结论变得可见:Claude 的用量,几乎是人作息的一面镜子。一天里几点问什么、一周里工作日和周末聊什么,都印在使用日志里。
最清楚的一条是工作日和周末的切换。采样期内,被归为「个人用途」的聊天和 Cowork 对话,占比从工作日的约 35% 升到周末的接近 50%。一到周末,人和 Claude 聊的东西就从商务函件、营销文案、PPT,换成情感支持、医疗问题、投资建议。这种切换在高收入国家最明显。
把请求拆得更细,还能看到具体哪些 Claude Code 任务在工作日和周末之间摆动最大。周末跌得最多的是后端架构、API 调试、数据存储;涨得最多的是 AI agent 设计、量化交易、游戏。跨国家看,「创业相关」的对话也在周六日最高,但找工作、投简历这类活动跟着其他工作任务一起回落。
一天之内同样有节奏。逐小时看,人在早上 7 点问新闻,商务函件沿工作日的弧线走、上午 10 到 11 点小高峰;其中一个最大的尖峰是菜谱请求,傍晚 6 点是均值的 2.3 倍;影视推荐集中在晚上,而求助睡眠建议集中在天亮前那几个小时。
夜里和周末,当人确实回头找 Claude 干活时,任务明显偏向高薪职业。营销经理、程序员这类工作更可能在常规时段之外进行;而底部两个工资四分位的工作(如电话销售、文书)占比下降。把「计算机和数学类」职业剔掉做稳健性检验后,这个结论依然成立。
采样期覆盖了美国报税截止日。4 月 14 日,税务类对话是 5 月日均的 8 倍,4 月 15 日仍居高位,到 4 月 16 日骤降。日历上的截止线,被一字不差地刻进了使用曲线。
这一版给每次聊天和 Cowork 对话按「产出物」分类:一份文档、一段解释、一段代码、一篇论文。93% 的对话能识别出明确产出物,最常见的是解释、文档和报告、指南。
对话型产出(解释、指南这类)和书面交付物(文档、PPT 这类)各占大约三分之一,代码和技术工作约占六分之一。同一种产出,用途可能完全不同:创意写作、指南、菜谱里超过 80% 是个人用途,而做营销内容、写博客、写数据库查询则八成以上偏工作。也有不少落在中间,比如做计划、翻译这类工作和个人几乎五五开。
算力大体随工作价值上升。把每次对话归到通常执行该任务的职业后能看到:营销经理时薪约是编辑的两倍(80 美元 vs 37 美元),对应对话耗的 token 也约是 2.5 倍。建 App 类对话用的 token 是中位数的三倍多,一条解释只用约五分之一。token 消耗的「工资梯度」里,约 44% 由产出类型的构成解释。
归到高薪职业的对话里,Claude 产出更多(每轮多 1.34 倍),用户参与也更多(多 1.53 倍轮次),扩展思考开得更频繁(34% vs 31%)。这几件事是一起涨的:Claude 产出更多,并不意味着用户产出更少。人留在最高价值的任务里,模式更像增强劳动而非替代劳动。
同样写一篇博客,聊天里的中位数要 13 轮来回;在 Claude Code 里,只有一句人类 prompt。Economic Index report: Cadences · 第二章
自主度用 1 到 5 分衡量,从「无」到「极高」。把聊天/Cowork 和 Claude Code 一比,一个反直觉的结论浮出来:同一件事,换个产品,AI 的放手程度就不一样,哪怕底层是同一个模型。
在展示的 31 类产出里,有 26 类在 Claude Code 上的自主度更高。最鲜明的例子还是博客:两个界面背后的请求和任务相似,但协作方式截然不同。
也许有人会把这归给模型选择:Claude Code 确实远更常跑在最强模型上(54% 由 Opus 服务,聊天和 Cowork 只有 10%)。但把对比限定在同一个模型上,差距依然在:在都用 Sonnet 的对话里,Claude Code 仍高出 0.26 分。所有对话平均下来,自主度差距是 0.37 分,其中约三分之二来自「同样的任务被以更高的委派程度执行」。用的是哪个产品,可能比底层是哪个模型更重要。
分类器给每次对话估两个阅读难度:用户的提问、Claude 的回答,都用「理解需要的受教育年数」表示。几乎每一类里,Claude 的回答都比提问高出大约一学年。差距最大的,是「描述一样东西、让它造出来」的场景。
面向受众的写作里差距几乎为零(博客 −0.1、学术论文 +0.0、邮件 +0.3),可能是因为这类提问本就用与成品同样的书面语起草。差距大的都是「描述需求让 AI 把东西造出来」的活:人给一句话,Claude 补上其余。
前两章讲人怎么用,这一章讲人怎么想。问卷关联了约 9700 名受访者的真实使用数据。先说样本的偏向:它不代表大众,计算机和数学类占受访者约 30%(美国就业里只占 4%),管理类占 23%(就业占 7%),体力职业则代表不足。
大多数人预期未来一年 AI 会有显著进步:近 6 成给明年选了比今天更高的档,超过三分之一预期明年 AI 能做自己大部分或几乎全部的工作任务。而且无论职业暴露度高低,大家对进步速度的预期高度一致:软件工程师和建筑经理,预期自己行业里 AI 的推进幅度差不多。
真正反直觉的是下面这条。研究者把对未来一年 AI 影响的判断拆成六个维度(薪资、工作稳定性、找新工作的能力,以及意义、自主性、人际互动),再看它怎么随「自动化占比」(把整段任务直接甩给 Claude 的程度)变化。结果是:六个维度上,用得越自动化的人都越乐观,其中对薪资和找工作的正面预期,效应最大。
焦虑的人是谁?是早期职业者:他们报告 AI 能干的活占比最高,对失业的担忧也最强。一个常被提起的担忧是「把整段任务交给 AI 等于把思考外包出去,技能会退化」。这份数据里没看到这个模式:重度委派者报告的学习率和其他人一样,觉得技能更值钱的比例还更高。但研究者明确提醒:这些是自评,并不能排除技能侵蚀。
担忧也真实存在,只是落点不在自己身上。超过三分之一的人认为自己工作职责很可能显著变化,10% 认为自己很可能失业(这些人里 38% 把预测归因于 AI)。但人们普遍更担心别人:超过三分之一认为初级同事未来一年丢工作的概率超过 60%。用法上还有一个明显的性别差异:女性只占关联样本的 12%,即便控制职业,她们的 Claude Code 占比低 6.3 个百分点、自动化占比低 7.3 个百分点,更倾向迭代式协作。
问卷以一道开放题收尾:希望十年后被 AI 塑造的经济是什么样。最高频的答案落点不在「被取代」:过半希望和 AI 协作做有意义的工作,刚过半希望 AI 把乏味的部分自动化掉、换来更多自由时间,约三分之一希望收益被广泛共享。
anthropic.com · 2026-06-26 · 作者 Maxim Massenkoff、Eva Lyubich、Szymon Sacher、Zoe Hitzig 等。本文论点与数字均出自该报告。文中图表为按原文数值重画的站点组件:节律小时图、六维度乐观图的条长为方向示意(原文未给精确系数,已在图注标明);其余比例、倍数、分值均为原文数据。问卷样本不代表大众,且为受访者自评,原文已就选择偏差与技能侵蚀给出保留说明。