METHOD · 原创方法论

三维决策框架

Three-Dimensional Decision Framework

重复度 × 规则化 × 失败代价。判断什么工作流值得 AI 化的尺子。

哪些工作流值得 AI 化？哪些不值得？

凭直觉判断的代价是：把不该自动化的工作流强行 AI 化，失败成本离谱；或者把能 AI 化的工作流放着不动，错过最容易吃到的红利。

我需要一把摆在桌面上、给任何工作流打分的尺子——而不是凭直觉。

为什么需要这把尺子

做过几个 AI 提效项目后我发现一件事：几乎每个团队都会问同一个问题——"我们这件事能不能 AI 化？"

直觉答案要么是"用 AI 多酷"（容易过度乐观），要么是"AI 还不行吧"（容易过度保守）。两种判断都不靠谱——它们都没在同一套维度上判断不同的工作流。

这把尺子的来源是一次系统性分析：基于 935 条真实任务数据（产品 / 研发 / 运营三个团队 / 3 份项目记录），我识别出 34 个可由 AI 替代或显著优化的工作流。在这个识别过程里，我反过来抽出了 3 个高复用的判断维度。

抽出来之后，再看任何一个新的工作流，都能在 30 秒内给出"该不该 AI 化、该到什么程度"的判断。

核心拆解 · 三个维度

| 维度 | 适合 AI | 不适合 AI | 真实样例 | |---|---|---|---| | 重复度 | 高频重复、模板化 | 一次性、需创造力 | 发票问题处理每天一条流程一致 vs 战略级 PRD 每份不同 | | 规则化程度 | 步骤固定、规则明确 | 需主观判断 | 测试用例按需求单结构化生成 vs 产品取舍判断 | | 失败代价 | 可回退、代价低 | 不可逆、代价高 | 文档初稿可反复改 vs 涉及金额或合规的操作 |

决策路径

三档分级 · 三类落地形态 · 从“我代你做”到“我提议、你定夺”

三档分级 → 三类落地形态：

全自动 —— 触发条件 → AI 执行 → 输出结果。人完全不在链路里。
高替代 —— AI 出初稿 → 人审核 → 发布。人是质量门。
辅助加速 —— AI 给建议 → 人决策执行。人是主角。

三个等级对应 AI 在协作中的"卡位深度"：从"我完全代你做"到"我提议、你定夺"。

在哪里用过

935 条任务数据 → 34 个工作流的分级结果

12 个【全自动】     占 35%   月报 / 测试用例 / 发票处理 / 月度数据汇总
15 个【高替代】     占 44%   PRD 编写 / 培训材料 / 数据分析报告
 7 个【辅助加速】   占 21%   原型设计 / 评审决策 / 用户反馈分级

最有信号的几个判定：

月报自动生成【全自动 · Quick Win】：高频 / 规则明确（拉数据按模板生成）/ 可回退（错了改）→ 三个维度全部指向"全自动"
PRD 编写【高替代】：高频 / 规则明确（章节结构固定）/ 但失败代价较高（影响产品判断）→ AI 出初稿 + 人工审核
发票问题处理【全自动】：每天一条流程一致 / 规则明确 / 可回退 → 全自动 + 飞书审批门控
战略级产品取舍【不 AI 化】：低频 / 主观判断 / 失败代价高 → 不在表里

用过这把尺子的项目

/works/media-ai —— 4 条产线的工具决策：为什么文字工作流走"高替代"而不是"全自动"（准确性是一票否决项）；为什么海报图文路径要拆 P1-P5 分级
/works/video-scribe —— 步骤分级：转写自动 / 翻译自动 / 题材识别自动 / 但 Step 3 精炼笔记的"个人批注"段保留人工（创造性输入不该被 AI 替代）

边界 · 什么时候不要用这把尺子

一、它只筛"可不可以"，不答"应不应该"。

一个工作流可能三维全绿（高频 / 规则化 / 可回退）——但如果团队没有人能维护它、没有数据流喂它、没有验收标准，就还是不要做。三维判断之外，还要看组织能力。这一点在内容中台项目里被反复验证："相邻业务线给过来的素材输入基本是断的" 暴露的不是 AI 能力问题，是组织协作问题。

二、不适合早期探索性场景。

早期产品阶段需要的是"快速试错 + 直觉判断"，强行用三维框架去筛，会过早收敛在已知的路径上。这把尺子适用于已经形成稳态工作流的团队，把已知重复劳动 AI 化；它不适用于"我们要不要做这个新方向"这类战略性问题。

三、维度之间不是独立的。

"规则化程度"看起来客观，但很多工作流的规则其实是"约定俗成"——把它写成明确规则需要先做一轮规则梳理。这一步比 AI 化本身更重要，也更耗时。如果跳过这一步直接用 AI，AI 会把约定俗成的隐性默契搞错。

核心提醒：这是一把"分级筛"，不是"自动判定器"。打完分还要人来拍板。

← 上一篇

三步精炼 Prompt 体系