深度研究助手
本文档演示如何端到端运行 Shannon 的深度研究流程:- 内联引用,并在“参考来源(Sources)”中完整罗列所有收集到的来源
- 论断(事实性陈述)校验:为每条论断匹配证据并计算置信度,发现冲突与未支撑项
- 语言匹配:回答语言与用户输入语言一致
- 策略预设:
quick/standard/deep/academic,并支持安全的覆盖项
先决条件
- 已启动的 Shannon 本地环境(Docker Compose)
- Gateway 可通过
http://localhost:8080访问 - (可选)若开启鉴权,请准备 API Key
快速开始(HTTP)
SSE 事件
LLM_OUTPUT:最终综合文本DATA_PROCESSING:进度/用量WORKFLOW_COMPLETED:工作流完成
策略预设
选择一个预设,并按需提供覆盖项。Gateway 会验证并映射到工作流上下文;工作流保持确定性(不读取文件)。quick | standard | deep | academic
覆盖项:
max_iterations(1..50)max_concurrent_agents(1..20)
enable_verification(布尔)report_mode(布尔)
说明
- 若未提供预设,默认回退为稳健的
standard配置。 - 预设仅在上下文未显式设置时,才会注入
enable_verification与report_mode。 config/research_strategies.yaml仅作为 Gateway 的参考文档;工作流不会读取(保持可重放的确定性)。
Python SDK
CLI
编程方式(Programmatic)
响应格式
GET /api/v1/tasks/{id} 返回的典型负载包含最终结果、元数据(引用、校验)、模型/提供商信息等。
result为最终综合的 Markdown/文本。metadata.citations列出所有收集到的来源(结果的 Sources 部分亦完整呈现)。metadata.verification在启用且成功执行校验时出现。metadata.verification.conflicts仅在检测到来源冲突时出现。created_at/updated_at为任务时间戳。usage(若返回)为 Token 用量汇总。model_used与provider反映综合阶段实际使用的模型/提供商。
功能亮点
引用
- 强制最少内联引用(默认 6;按可用来源上限收紧;最低 3)
- “Sources” 末尾完整列出所有收集到的来源,并标注:
- “Used inline”(已在正文引用) vs “Additional source”(额外来源)
- 基于 URL 与 DOI 的去重
校验(Verification)
- 从综合结果中抽取事实性陈述(论断)
- 为每条论断匹配来源并计算置信度(按可信度加权)
- 标注冲突与未支撑的论断
- 在综合之后、反思之前执行;失败时不阻断流程
语言匹配
- 根据用户查询做轻量的语言检测
- 综合结果使用相同语言回答
- 使用通用指令,兼容多语言场景
提示
- 测试时可设置
context.force_research=true路由到 ResearchWorkflow - 使用策略预设控制研究深度与并发
- 通过 SSE 监控进度与 Token 用量
故障排查
web_search的search_type无效:已做容错,回退为auto- 跨域重复来源:已通过 DOI 归一在一定程度上规避
- 若输出语言回落为英文,请确认查询语言与版本(≥ v3.1)
可用性
- 引用:已启用(内部门控
citations_v1) - 校验:已启用(内部门控
verification_v1) - 语言匹配:当前版本可用(自 v3.1 起)
- 策略预设:当前版本可用(自 v3.2 起)