METHOD · 原创方法论

双数据源架构

Dual-Source Architecture

外部资讯线 + 内部知识线，互为补充。AI 内容生产的基石。

时效性和覆盖面是两个不同的维度。很难用一条数据线同时解决。

我做内容中台时一开始只想做一件事：把外部资讯自动聚合起来，让运营少花时间收集。第一版跑了一周，运营反馈了一句话——

"实际新媒体营销是要围绕产品服务的，还是从产品出发提炼选题。"

这一句话把我的设计撕开了一个口子：只有资讯线，内容跟产品脱节。

为什么需要这把架构

内容型 AI 产品的核心矛盾：用户因为热点才进来，因为产品才留下。

单一数据源结构在两个方向上各有致命短板：

| 单源类型 | 优势 | 致命短板 | |---|---|---| | 只有资讯线 | 时效性强，热点跟得上 | 内容跟产品脱节 —— 你发了 100 条招投标资讯，用户不知道你们公司是干嘛的 | | 只有知识线 | 产品覆盖全，每条内容都关联产品价值 | 没有引流能力 —— 内容干巴巴像产品说明书 |

这两个短板是结构性的——单线没法同时解时效性和覆盖面。任何只用一条数据源的内容生产系统，要么注定无法转化（资讯线），要么注定无法引流（知识线）。

双源并行不是"做两遍"，是把两个维度交给两条独立数据线分别负责——资讯负责引流，知识负责转化。

核心拆解 · 两条线 + 一个中台

资讯负责引流 · 知识负责转化 · 两个维度由两条独立数据线分别负责

三个承重墙字段

中台层有三个字段是整个架构的承重墙，缺一个整套系统都跑不通：

使用去向（多选字段）—— 一条素材是否被问答用过、是否被文章用过、是否被视频用过。下游所有筛选逻辑都靠它。
关联素材编号 —— 每个产出内容反指它用了哪条原始素材，方便溯源和质量回查。
被引用次数 —— 每次知识点被使用就 +1，下一轮选题时给低于均值的知识点优先权。反馈性约束，避免 LLM 注意力偏差导致热点反复轮播。

两条数据线的"角色分工"

| 线 | 负责什么 | 由什么决定优先级 | |---|---|---| | 资讯线 | 引流 —— 让用户因为热点点进来 | 时效性（7 天 / 30 天窗口）+ 跨平台热度 | | 知识线 | 转化 —— 让点进来的用户发现产品能解决问题 | 覆盖面（冷热均衡 + 产品线分布） |

这个分工就是双数据源的核心价值：每条线只对一个维度负责，避免一条线被两个矛盾的目标拉扯。

在哪里用过

主要实现 · /works/media-ai

文字工作流：6 个外部采集源 + 42 个内部产品知识点 + 21 个关键词语义桥梁。资讯驱动出问答（追热点）+ 知识驱动出文章（主动铺量）。
政策短视频生产线：复用同一套数据源 + 中台，下游换成视频脚本生成。
海报图文 / 动漫剧场：复用同一套，证明这套结构跨内容形态可扩展。

最有信号的验证：4 条产线接入第 4 条（动漫剧场）时只新增 2 个任务 + 1 张飞书表，零额外基建——证明双源中台的复用率拉满。

可迁移到的场景

四层抽象后（异构源 → 标准化中台 → 业务生成层 → 多渠道分发），这套结构可直接套到：

| 业务场景 | 资讯线 | 知识线 | 输出 | |---|---|---|---| | 电商内容 | 热搜词 / 站外种草 / 竞品上新 | SKU 库 / 用户评价 / 客服 FAQ | 详情页文案 / 种草笔记 / 直播话术 | | HR 招聘 | 行业人才动态 / 薪酬报告 | 岗位 JD / 公司故事 / 员工采访 | 招聘推文 / 内推话术 / 高校宣讲 | | 客服自动化 | 用户新问题 / 舆情 | FAQ / 产品知识库 | 标准答案 / 工单分类 |

判断一个业务能不能套：问自己两个问题——

是否需要时效性内容（追热点 / 跟新闻）？
是否有结构化的内部资产（产品 / FAQ / 案例）？

两个都是 yes → 双源架构成立；只有一个 yes → 单源就够，不要为了套架构而套。

边界 · 什么时候不要用

一、不适合数据稀缺场景。

任何一条数据线都需要持续稳定的输入。如果外部资讯源每周更新 1-2 条，或者内部知识库只有 10 个知识点——双源架构跑起来是空的。双源的前置条件是双源都有"量"。内容中台一开始只有 42 个知识点，已经是勉强够；如果只有 10 个，根本不该上这套结构。

二、不适合两条数据源高度重合的场景。

如果外部资讯本身就是内部知识库的镜像（比如行业 wiki 类业务），双源是冗余的。双源的价值前提是"两条线在不同维度上互补"，重合度太高就退化成单源 + 备份。

三、不适合短生命周期内容。

爆款短视频、限时活动文案这类生命周期 < 1 周的内容，时效性占绝对主导，知识线的"长期覆盖"逻辑用不上。这时单资讯线 + 强人工选题更高效。

核心提醒：双源不是"做两遍"，是"分维度负责"。如果两条线的输入、输出、判定逻辑都几乎一样，那不是双源——是单源加了个备份。

三步精炼 Prompt 体系