简介
AI 智能体是一个自主系统,能够感知环境、做出决策并采取行动以实现目标。在 Shannon 中,智能体是使用大型语言模型(LLM)和工具处理任务的基本执行单元。智能体能力
Shannon 智能体可以:推理
使用 LLM 分析任务、规划解决方案并做出决策
执行工具
调用函数、运行代码、搜索网络并与 API 交互
协作
与其他智能体协作解决复杂的多步骤问题
学习
通过模式学习和缓存结果不断改进
智能体生命周期
以下是智能体处理任务的流程:1
任务分析
智能体接收任务并分析需要完成的工作
2
规划
LLM 创建计划,可能会分解为多个步骤
3
工具选择
智能体识别需要使用哪些工具
4
执行
迭代执行工具并处理结果
5
综合
将结果组合成最终答案
Shannon 中的智能体类型
单智能体(简单模式)
单个智能体处理整个任务而不进行分解。 最适合:- 简单查询
- 事实检索
- 基本计算
- 快速响应
Shannon 会自动为简单查询选择单智能体模式。
多智能体(标准/复杂模式)
多个专业智能体协同工作,由 Shannon 的编排器进行协调。 最适合:- 复杂研究
- 多步骤工作流
- 需要不同专业知识的任务
- 需要并行处理的任务
Shannon 会根据查询复杂度自动将复杂查询分解为多智能体工作流。
智能体组件
1. LLM 大脑
由语言模型驱动的决策核心:- 模型选择:Shannon 根据任务复杂度自动选择模型
- 小型任务 →
gpt-5-mini、claude-haiku - 复杂任务 →
gpt-5、claude-opus
- 小型任务 →
- 上下文管理:自动管理上下文窗口
- 缓存:在适用时重用之前的 LLM 响应
2. 工具系统
智能体可以执行各种工具: 内置工具:- Python 代码执行(WASI 沙箱隔离)
- 网络搜索(Google/Serper/Bing/Exa/Firecrawl)
- 文档检索
- 数学计算
3. 记忆系统
智能体维护两种类型的记忆: 会话记忆:- 对话中的短期上下文
- 存储在 Redis(TTL 可配置,默认 30 天)
- 支持多轮对话
- Qdrant 中的长期语义记忆
- 跨会话检索
- MMR 多样性获取相关上下文
平台配置
Shannon 的行为通过环境变量在平台级别进行配置:模型层级
Shannon 根据配置的层级自动选择模型:| 层级 | 模型 | 用例 | 成本 |
|---|---|---|---|
| SMALL | gpt-5-mini、claude-haiku | 简单查询、高容量 | $ |
| MEDIUM | gpt-5、claude-sonnet | 通用目的 | $$ |
| LARGE | gpt-5-thinking、claude-opus | 复杂推理、关键任务 | $$$ |
Shannon 的智能路由器为每个任务选择最具成本效益的模型,通常可节省 60–90% 的成本(取决于工作负载)。
智能体协调模式
Shannon 使用经过验证的认知模式进行多智能体协调:思维链(CoT)
每个步骤都基于前一步构建的顺序推理:思维树(ToT)
探索性回溯以解决复杂问题:ReAct(推理 + 行动)
用于动态任务的推理和行动交替:安全性和隔离
Shannon 智能体在安全的环境中运行:WASI 沙箱
所有代码执行都在 WebAssembly 系统接口沙箱中进行,具有以下特性:
- 无网络访问
- 只读文件系统
- 内存限制
- 执行超时
OPA 策略执行
控制智能体可以做什么:最佳实践
1. 选择正确的模式
- 简单:单步任务、快速响应
- 标准:多步任务、中等复杂度
- 复杂:研究、分析、高级推理
2. 设置预算限制
在平台级别配置令牌和成本限制以防止意外费用:3. 使用会话保持上下文
对于多轮对话,使用一致的session_id: