← 返回方法论
METHOD · 原创方法论

三维决策框架

Three-Dimensional Decision Framework

重复度 × 规则化 × 失败代价。判断什么工作流值得 AI 化的尺子。

哪些工作流值得 AI 化?哪些不值得?

凭直觉判断的代价是:把不该自动化的工作流强行 AI 化,失败成本离谱;或者把能 AI 化的工作流放着不动,错过最容易吃到的红利。

我需要一把摆在桌面上、给任何工作流打分的尺子——而不是凭直觉。

01

为什么需要这把尺子

做过几个 AI 提效项目后我发现一件事:几乎每个团队都会问同一个问题——"我们这件事能不能 AI 化?"

直觉答案要么是"用 AI 多酷"(容易过度乐观),要么是"AI 还不行吧"(容易过度保守)。两种判断都不靠谱——它们都没在同一套维度上判断不同的工作流。

这把尺子的来源是一次系统性分析:基于 935 条真实任务数据(产品 / 研发 / 运营三个团队 / 3 份项目记录),我识别出 34 个可由 AI 替代或显著优化的工作流。在这个识别过程里,我反过来抽出了 3 个高复用的判断维度

抽出来之后,再看任何一个新的工作流,都能在 30 秒内给出"该不该 AI 化、该到什么程度"的判断。

02

核心拆解 · 三个维度

| 维度 | 适合 AI | 不适合 AI | 真实样例 | |---|---|---|---| | 重复度 | 高频重复、模板化 | 一次性、需创造力 | 发票问题处理每天一条流程一致 vs 战略级 PRD 每份不同 | | 规则化程度 | 步骤固定、规则明确 | 需主观判断 | 测试用例按需求单结构化生成 vs 产品取舍判断 | | 失败代价 | 可回退、代价低 | 不可逆、代价高 | 文档初稿可反复改 vs 涉及金额或合规的操作 |

决策路径

都高其一低可回退不可逆重复度 + 规则化失败代价【辅助加速】AI 建议 · 人决策【全自动】触发 → 执行【高替代】初稿 → 人审核
三档分级 · 三类落地形态 · 从"我代你做"到"我提议、你定夺"

三档分级 → 三类落地形态

三个等级对应 AI 在协作中的"卡位深度":从"我完全代你做"到"我提议、你定夺"。

03

在哪里用过

935 条任务数据 → 34 个工作流的分级结果

12 个【全自动】     占 35%   月报 / 测试用例 / 发票处理 / 月度数据汇总
15 个【高替代】     占 44%   PRD 编写 / 培训材料 / 数据分析报告
 7 个【辅助加速】   占 21%   原型设计 / 评审决策 / 用户反馈分级

最有信号的几个判定:

用过这把尺子的项目

04

边界 · 什么时候不要用这把尺子

一、它只筛"可不可以",不答"应不应该"。

一个工作流可能三维全绿(高频 / 规则化 / 可回退)——但如果团队没有人能维护它、没有数据流喂它、没有验收标准,就还是不要做。三维判断之外,还要看组织能力。这一点在内容中台项目里被反复验证:"相邻业务线给过来的素材输入基本是断的" 暴露的不是 AI 能力问题,是组织协作问题。

二、不适合早期探索性场景。

早期产品阶段需要的是"快速试错 + 直觉判断",强行用三维框架去筛,会过早收敛在已知的路径上。这把尺子适用于已经形成稳态工作流的团队,把已知重复劳动 AI 化;它不适用于"我们要不要做这个新方向"这类战略性问题。

三、维度之间不是独立的。

"规则化程度"看起来客观,但很多工作流的规则其实是"约定俗成"——把它写成明确规则需要先做一轮规则梳理。这一步比 AI 化本身更重要,也更耗时。如果跳过这一步直接用 AI,AI 会把约定俗成的隐性默契搞错。

§

核心提醒这是一把"分级筛",不是"自动判定器"。打完分还要人来拍板。