2.2.0 - 动态Agent路由

2025年5月16日

超长上下文支持

  • 采用片段式记忆压缩,将早期对话嵌入为摘要并附带向量索引,同一会话可容纳更长历史,多轮追问无需反复描述背景,减少token消耗。

多模态上下文融合

  • 引入三模态嵌入对齐网络,智能体能跨模态引用历史信息回答,让提到的“这张图”“刚才那句话”都能被准确关联。

意图选链路

  • 按意图为对话选择最短模型链,缩短延时同时节约推理成本。