双数据源架构
Dual-Source Architecture
外部资讯线 + 内部知识线,互为补充。AI 内容生产的基石。
时效性 和 覆盖面 是两个不同的维度。很难用一条数据线同时解决。
我做内容中台时一开始只想做一件事:把外部资讯自动聚合起来,让运营少花时间收集。第一版跑了一周,运营反馈了一句话——
"实际新媒体营销是要围绕产品服务的,还是从产品出发提炼选题。"
这一句话把我的设计撕开了一个口子:只有资讯线,内容跟产品脱节。
为什么需要这把架构
内容型 AI 产品的核心矛盾:用户因为热点才进来,因为产品才留下。
单一数据源结构在两个方向上各有致命短板:
| 单源类型 | 优势 | 致命短板 | |---|---|---| | 只有资讯线 | 时效性强,热点跟得上 | 内容跟产品脱节 —— 你发了 100 条招投标资讯,用户不知道你们公司是干嘛的 | | 只有知识线 | 产品覆盖全,每条内容都关联产品价值 | 没有引流能力 —— 内容干巴巴像产品说明书 |
这两个短板是结构性的——单线没法同时解时效性和覆盖面。任何只用一条数据源的内容生产系统,要么注定无法转化(资讯线),要么注定无法引流(知识线)。
双源并行不是"做两遍",是把两个维度交给两条独立数据线分别负责——资讯负责引流,知识负责转化。
核心拆解 · 两条线 + 一个中台
三个承重墙字段
中台层有三个字段是整个架构的承重墙,缺一个整套系统都跑不通:
- 使用去向(多选字段)—— 一条素材是否被问答用过、是否被文章用过、是否被视频用过。下游所有筛选逻辑都靠它。
- 关联素材编号 —— 每个产出内容反指它用了哪条原始素材,方便溯源和质量回查。
- 被引用次数 —— 每次知识点被使用就 +1,下一轮选题时给低于均值的知识点优先权。反馈性约束,避免 LLM 注意力偏差导致热点反复轮播。
两条数据线的"角色分工"
| 线 | 负责什么 | 由什么决定优先级 | |---|---|---| | 资讯线 | 引流 —— 让用户因为热点点进来 | 时效性(7 天 / 30 天窗口)+ 跨平台热度 | | 知识线 | 转化 —— 让点进来的用户发现产品能解决问题 | 覆盖面(冷热均衡 + 产品线分布) |
这个分工就是双数据源的核心价值:每条线只对一个维度负责,避免一条线被两个矛盾的目标拉扯。
在哪里用过
主要实现 · /works/media-ai
- 文字工作流:6 个外部采集源 + 42 个内部产品知识点 + 21 个关键词语义桥梁。资讯驱动出问答(追热点)+ 知识驱动出文章(主动铺量)。
- 政策短视频生产线:复用同一套数据源 + 中台,下游换成视频脚本生成。
- 海报图文 / 动漫剧场:复用同一套,证明这套结构跨内容形态可扩展。
最有信号的验证:4 条产线接入第 4 条(动漫剧场)时只新增 2 个任务 + 1 张飞书表,零额外基建——证明双源中台的复用率拉满。
可迁移到的场景
四层抽象后(异构源 → 标准化中台 → 业务生成层 → 多渠道分发),这套结构可直接套到:
| 业务场景 | 资讯线 | 知识线 | 输出 | |---|---|---|---| | 电商内容 | 热搜词 / 站外种草 / 竞品上新 | SKU 库 / 用户评价 / 客服 FAQ | 详情页文案 / 种草笔记 / 直播话术 | | HR 招聘 | 行业人才动态 / 薪酬报告 | 岗位 JD / 公司故事 / 员工采访 | 招聘推文 / 内推话术 / 高校宣讲 | | 客服自动化 | 用户新问题 / 舆情 | FAQ / 产品知识库 | 标准答案 / 工单分类 |
判断一个业务能不能套:问自己两个问题——
- 是否需要时效性内容(追热点 / 跟新闻)?
- 是否有结构化的内部资产(产品 / FAQ / 案例)?
两个都是 yes → 双源架构成立;只有一个 yes → 单源就够,不要为了套架构而套。
边界 · 什么时候不要用
一、不适合数据稀缺场景。
任何一条数据线都需要持续稳定的输入。如果外部资讯源每周更新 1-2 条,或者内部知识库只有 10 个知识点——双源架构跑起来是空的。双源的前置条件是双源都有"量"。内容中台一开始只有 42 个知识点,已经是勉强够;如果只有 10 个,根本不该上这套结构。
二、不适合两条数据源高度重合的场景。
如果外部资讯本身就是内部知识库的镜像(比如行业 wiki 类业务),双源是冗余的。双源的价值前提是"两条线在不同维度上互补",重合度太高就退化成单源 + 备份。
三、不适合短生命周期内容。
爆款短视频、限时活动文案这类生命周期 < 1 周的内容,时效性占绝对主导,知识线的"长期覆盖"逻辑用不上。这时单资讯线 + 强人工选题更高效。
核心提醒:双源不是"做两遍",是"分维度负责"。如果两条线的输入、输出、判定逻辑都几乎一样,那不是双源——是单源加了个备份。