三维决策框架
Three-Dimensional Decision Framework
重复度 × 规则化 × 失败代价。判断什么工作流值得 AI 化的尺子。
哪些工作流值得 AI 化?哪些不值得?
凭直觉判断的代价是:把不该自动化的工作流强行 AI 化,失败成本离谱;或者把能 AI 化的工作流放着不动,错过最容易吃到的红利。
我需要一把摆在桌面上、给任何工作流打分的尺子——而不是凭直觉。
为什么需要这把尺子
做过几个 AI 提效项目后我发现一件事:几乎每个团队都会问同一个问题——"我们这件事能不能 AI 化?"
直觉答案要么是"用 AI 多酷"(容易过度乐观),要么是"AI 还不行吧"(容易过度保守)。两种判断都不靠谱——它们都没在同一套维度上判断不同的工作流。
这把尺子的来源是一次系统性分析:基于 935 条真实任务数据(产品 / 研发 / 运营三个团队 / 3 份项目记录),我识别出 34 个可由 AI 替代或显著优化的工作流。在这个识别过程里,我反过来抽出了 3 个高复用的判断维度。
抽出来之后,再看任何一个新的工作流,都能在 30 秒内给出"该不该 AI 化、该到什么程度"的判断。
核心拆解 · 三个维度
| 维度 | 适合 AI | 不适合 AI | 真实样例 | |---|---|---|---| | 重复度 | 高频重复、模板化 | 一次性、需创造力 | 发票问题处理每天一条流程一致 vs 战略级 PRD 每份不同 | | 规则化程度 | 步骤固定、规则明确 | 需主观判断 | 测试用例按需求单结构化生成 vs 产品取舍判断 | | 失败代价 | 可回退、代价低 | 不可逆、代价高 | 文档初稿可反复改 vs 涉及金额或合规的操作 |
决策路径
三档分级 → 三类落地形态:
- 全自动 —— 触发条件 → AI 执行 → 输出结果。人完全不在链路里。
- 高替代 —— AI 出初稿 → 人审核 → 发布。人是质量门。
- 辅助加速 —— AI 给建议 → 人决策执行。人是主角。
三个等级对应 AI 在协作中的"卡位深度":从"我完全代你做"到"我提议、你定夺"。
在哪里用过
935 条任务数据 → 34 个工作流的分级结果
12 个【全自动】 占 35% 月报 / 测试用例 / 发票处理 / 月度数据汇总
15 个【高替代】 占 44% PRD 编写 / 培训材料 / 数据分析报告
7 个【辅助加速】 占 21% 原型设计 / 评审决策 / 用户反馈分级
最有信号的几个判定:
- 月报自动生成【全自动 · Quick Win】:高频 / 规则明确(拉数据按模板生成)/ 可回退(错了改)→ 三个维度全部指向"全自动"
- PRD 编写【高替代】:高频 / 规则明确(章节结构固定)/ 但失败代价较高(影响产品判断)→ AI 出初稿 + 人工审核
- 发票问题处理【全自动】:每天一条流程一致 / 规则明确 / 可回退 → 全自动 + 飞书审批门控
- 战略级产品取舍【不 AI 化】:低频 / 主观判断 / 失败代价高 → 不在表里
用过这把尺子的项目
- /works/media-ai —— 4 条产线的工具决策:为什么文字工作流走"高替代"而不是"全自动"(准确性是一票否决项);为什么海报图文路径要拆 P1-P5 分级
- /works/video-scribe —— 步骤分级:转写自动 / 翻译自动 / 题材识别自动 / 但 Step 3 精炼笔记的"个人批注"段保留人工(创造性输入不该被 AI 替代)
边界 · 什么时候不要用这把尺子
一、它只筛"可不可以",不答"应不应该"。
一个工作流可能三维全绿(高频 / 规则化 / 可回退)——但如果团队没有人能维护它、没有数据流喂它、没有验收标准,就还是不要做。三维判断之外,还要看组织能力。这一点在内容中台项目里被反复验证:"相邻业务线给过来的素材输入基本是断的" 暴露的不是 AI 能力问题,是组织协作问题。
二、不适合早期探索性场景。
早期产品阶段需要的是"快速试错 + 直觉判断",强行用三维框架去筛,会过早收敛在已知的路径上。这把尺子适用于已经形成稳态工作流的团队,把已知重复劳动 AI 化;它不适用于"我们要不要做这个新方向"这类战略性问题。
三、维度之间不是独立的。
"规则化程度"看起来客观,但很多工作流的规则其实是"约定俗成"——把它写成明确规则需要先做一轮规则梳理。这一步比 AI 化本身更重要,也更耗时。如果跳过这一步直接用 AI,AI 会把约定俗成的隐性默契搞错。
核心提醒:这是一把"分级筛",不是"自动判定器"。打完分还要人来拍板。