Youtu-GraphRAG核心组件
- 图谱构建层——种子图模式 (Seed Graph Schema)+自动化提取智能体
- 功能:系统的基础,根据预定义的Schema,自动从原始文档提取实体、关系、属性,构建出初始的知识图谱。
总结:
- 种子图模式本质上是为信息提取智能体设定的“标准化指令和输出格式模板”,没有这个模板,智能体提取的信息就会是杂乱无章的。
- “seed”表示该模式的可生长性,当智能体处理新领域文档时,发现了模式中未定义的但重要的新实体或者关系,系统就课题把这个新类型登记到模式中,图谱的Schema和提取能力完成进化,可以实现跨领域迁移。
- 知识组织层——双重感知社区检测 (Dually-perceived Community Detection)
- 功能:将结构化的图谱提升为具有深层语义的知识树。通过融合图结构和文本语义,生成结构清晰、层级化的知识树,并为每个社区生成预摘要。
总结:
在构建社区过程中考虑两种信号:结构拓扑感知、子图语义感知
- 结构拓扑感知:关注节点之间连接的紧密程度,连接越密集的区域,越可能形成一个社区
- 子图语义感知:关注社区内部节点文本内容相似性。即使两个节点在图结构上不那么紧密,但如果语义高度相关,也被归入同一个社区
- 智能检索与推理层——智能体检索器 (Agentic Retriever)
- 功能:利用知识树,通过查询分解、并行检索、迭代反思等策略,最终生成全面而准确的答案。
总结:
分为两个阶段:自上而下的查询分解、自下而上的迭代反思
- 自上而下的查询分解:将宏大的用户问题,利用知识树的层级,分解为针对特定社区的、可管理的子任务
- 自下而上的迭代反思:将初步检索到的具体信息,进行深度分析和关联,从而发现新的推理路径,自底向上修正或丰富最终的整体答案
Youtu-GraphRAG工作流程

