Anthropic Founder's Playbook · Deep Dive

AI-Native 创业的
6结构性
失败模式

当构建成本趋近于零,"判断力"成为唯一稀缺资源。
这些不是旧问题翻新——是 AI 时代结构性引入的新失败。

来源 · Anthropic 2026-05-06 v3 篇幅 · 34 页 PDF 事实核查 · 三轮通过
6
failure  modes

所有 6 个 mode 共用同一个机制:传统创业里阻挡你的成本——构建成本、工程时间、技术能力——不是阻碍,是天然筛选器。Lean Startup 的纪律之所以能落地,因为它有经济理性兜底。

2026 年 agentic coding 把这些约束压平之后,"先想清楚再造"从经济理性退化为纯纪律问题。而没有外部约束的纪律是脆弱的。

这篇文章按 PDF 章节顺序展开 6 个 mode,机制 / 元问题 / 解药三段式。原文措辞 verbatim 保留;编辑性扩展(如 traditional vs agentic 技术债对照表)会明确标注。

The setup

Lean Startup 之所以能落地,
是因为有经济理性兜底。
当成本归零,纪律失去支撑。

01
Failure Mode 01

构建即验证幻觉Mistaking Building for Validating

原型本身被当成了证据——"this is a working prototype, therefore my idea must be right"——但原型只是在脑内重述了你的假设,从未在外部世界被测试过。

have an idea
immediately build a prototype
treat the existence of the prototype as validation

过去构建有高成本(时间 / 资金 / 技术能力),这成本本身就是筛选器——你必须先说服自己这值得造。Agentic coding 把成本降到接近零后,这个经济约束消失了

Anthropic 原文很直白:"The prototype becomes a reason to believe the hypothesis was right all along, without ever testing whether it's actually true."

什么变了?过去"我有想法"和"我有产品"之间隔着数月的 dev time。现在这两步在心理上几乎同时发生——但它们代表的验证深度完全不同。AI 极短时间造出的原型给创始人带来的心理满足感,和过去需要数月的原型几乎相同;区分被磨没了。
42%

创业失败因为造了没人要的东西。Anthropic 原文:"that failure rate is only going to climb."

Source · Founder's Playbook p.10

解药 — 三道 exit criteria

  1. 问题真实且具体?能说出谁、多频繁、多严重、现在怎么应对
  2. 方案是否解决验证过程揭示的实际问题,而非你最初假设的
  3. 足够信号 justify 投入?"a reasoned decision over an act of faith"
02
Failure Mode 02

Agentic 技术债A new species, not a bigger version of the old one

原文:"You end up with a codebase that has no coherent mental model behind it, not because any single piece is bad, but because the pieces were never designed to fit together."

无 spec / 无 CLAUDE.md / 无设计文档

AI 每个 session 独立推导基础架构决策

不同 session 给出合理但互不兼容的结论

每段单独看都 OK,拼起来不构成系统

# Project: payments-svc # 这不是给人看的,是给 AI 看的—— # 防止每次 session 重新发明 ORM/分层/认证 ## Architecture invariants - ORM: SQLAlchemy 2.x async; 禁用 Django ORM 风格 - Auth: JWT in Authorization header; 禁用 cookie session - Errors: structured exceptions w/ correlation_id - Layering: api → service → repository; 禁跨层调用 # <=== 这个文件不是"good practice",是基础设施
关键认知翻转:架构文档在 AI-native 开发中的价值发生根本性变化——传统作用是帮人理解代码(人也不怎么读),新作用是约束 AI 的决策空间,防止每次 session 发散。CLAUDE.md 不是 nice-to-have,是 hard infrastructure。

编辑性扩展 — 传统技术债 vs Agentic 技术债

↓ 这张对照表是基于 PDF 论点的整理,原文未直接给出对照

维度
传统技术债
Agentic 技术债
本质
写得差
从未被设计过
方向性
你知道"应该"怎么做
没人定义过"正确"长什么样
可重构性
明确的目标状态
重构目标本身不存在
增长速度
线性(人的速度)
复合增长 (compounds)
检测信号
代码 review 能发现
每段都合理,问题在"拼图不吻合"
这种债不是"写得差",是"从来没被设计过"——
没有一致性可以重构回去。
直接解释了 vibe coding 产品在 prototype → production 时崩溃的原因。
中场观察

前两个 mode 共享一个机制:
外部约束消失
本能行为没有被替换为系统化做法。

03
Failure Mode 03

Confirmation Bias 闭环Loss of objectivity

原文:"Ask an AI tool for evidence supporting what you already believe, and it will find it. Confirmation bias now comes with a research engine."

FOUNDER 有想法 PROMPT "验证一下" AI 默认顺从 "EVIDENCE" 支持论据 闭环 无对冲

过去 — 多重对冲

联合创始人挑战 + 投资人尽调 + 工程团队推回——
每一个环节都是独立的 challenge 源。

现在 — 闭环完成

AI 是唯一研究伙伴 + 默认顺从 + 无外部 challenge
→ 信念在自己的回声里被加强。

这本质是系统结构问题,不是意志力问题。每一代创始人都有 confirmation bias,但过去至少有人付费来反对你;现在没了。

解药 — 把 prompt 起点反过来

原文:"The antidote is the same tool, only pointed in the opposite direction."

"帮我验证这个想法"
"尽全力证明这个想法行不通"
"这个市场有多大"
"为什么这个市场不存在"
"我的优势是什么"
"竞争对手会为什么赢"
对称性审计:每生成一份支持性分析,要求等长度的反对分析。这不是流程美德,是对结构性失衡的补偿。
04
Failure Mode 04

零摩擦 Scope CreepZero-friction scope creep

原文:"Each individual addition is defensible. Of course the product should handle that edge case... These don't feel like scope creep in the moment."

scope = fuser_value, eng_cost, opportunity_cost
eng_cost → 0
scope = fuser_value, eng_cost, opportunity_cost
scope = f(user_value)
// 只要有一点点价值就加
结构翻转:稀缺资源从"工程能力"转向"注意力和方向感"。在 AI 时代,"不造"比"造"更需要纪律——后者过去靠工程时间天然限制,现在彻底失去了。

解药 — 动手前写 scope 文档

不是给团队看的承诺,是给未来的自己设的结构化拒绝机制

scope.md v1 · before any code
① 产品做什么 — what we DO

具体核心交互。不是愿景陈述,是动作清单:用户登录后能做什么、不能做什么、看到什么界面。

② 产品故意不做什么 — what we explicitly DON'T

明确拒绝的方向。这部分通常是创始人最不愿意写的,因为每一项都是放弃的可能性——但它正是这份文档的价值。

③ Feature gate — 什么证据 justify 加新东西

触发条件而非排斥规则——不是"不允许加",是"加之前需要看到什么"。

Gate criterion (PDF 原文):"a critical mass of users have told us they can't get value from the product without this."

把决策从 "我们能造吗?" 变成 "有用户因为没有这个而流失吗?"

05
Failure Mode 05 · Defense Theory

数据护城河 + 工作流锁定The actual moat theory for the AI era

PDF 中最具理论价值的部分——AI 时代的双层防御理论。原始模型能力会被 commoditize,可持续护城河来自数据复合 × 用户工作流嵌入。

Layer 01 — 难复制

Compounding Data Network Effect

不是通用数据规模壁垒。是垂直场景中特定用户群的行为模式积累。

用户使用 → 行为信号
→ 学到 user pattern
→ 产品变好
→ 更多使用
  • Time-locked:竞品今天开始做也无法复制长期累积的行为指纹
  • Context-specific:通用模型再强也学不到你这个垂直场景的隐性 pattern
time-locked context-specific
Layer 02 — 难离开

Workflow Lock-in

用户用得越久,产品嵌入越深,切换成本越接近 operational project

  • 用户在你的产品上构建的自动化、prompts、workflows
  • 内部数据源 + 外部工具集成 + 团队训练 — 每个都是切换阻力
  • switching = product decision → full-scale operational project
最深锁定:API、webhook、SDK — 客户在你的产品之上 build,不只是 use。这一刻起,你已经不是供应商,是基础设施。
战略推论:这两层是 AI 时代真正能用的护城河——不是模型独占(行业共识:模型差距会持续收窄),不是 UI 优势(容易被复制)。前者来自时间,后者来自嵌入深度,两者都需要从产品 day-1 设计——不能后期补。
06
Failure Mode 06

创始人变瓶颈From asset to constraint

原文:"At MVP, the founder being in every loop was an asset. At Launch, that same instinct becomes the constraint." 在 AI-native 公司里,这问题在极小团队就出现——产品增长很快,但创始人注意力没同步扩容。

症状清单 (PDF 原文)
  • 本该 1 小时的决策,需要一周才能轮到
  • Support request 堆积——只有你知道答案
  • 有些运营任务只在你记得做时才发生
  • 组织在你周围停滞
解药 — 三分类 triage
可完全自动化
AI workflow
需要人但不必是你
SOP / delegate
必须是你
这才是你的时间
"一周不在"测试 用 Claude 推演如果你一周不在每个 workflow 会怎样。
卡住的就是你还在亲力亲为的地方——也是下一个该 systematize 的地方。
Meta-Argument

共同元论点:
当"做"无限容易,
"想清楚"成为唯一稀缺资源。

都是 AI 时代特有的

不是旧问题翻新,是技术变革引入的结构性新问题。Scope creep / confirmation bias / founder bottleneck 这些名字旧时代有,但触发条件、放大机制、规模阈值全变了。

都指向同一元问题

"做"变得无限容易时,"想清楚"的相对价值急剧上升。判断力、方向感、品味——这些过去被工程能力遮蔽的能力,现在裸露在外。

都涉及"约束消失"

成本、时间、能力约束消失后,需要新的人为约束来填补。Scope 文档、CLAUDE.md、对称性审计、一周不在测试——都是同一种动作:人为重建天然约束。

Anthropic Founder's Playbook · 2026
"The bottlenecks are no longer
what you can build,
but what you choose to build."
— core insight, distilled across all 6 modes

References