包阅导读总结
1. 关键词:代理工作流、人工智能、设计模式、工作流编排、商业应用
2. 总结:本文探讨了代理工作流(Agentic Workflow)在人工智能中的应用,介绍了其关键设计模式,包括反思、工具使用、规划、多代理协作,还阐述了工作流编排的整体架构和其在商业中的应用案例,提及了一些开源项目。
3.
– 代理工作流是人工智能新潮流
– 是一种复杂但易理解的方法,能提升数字效率
– 设计模式包括反思、工具使用、规划、多代理协作
– 反思是自我修正历史回复内容
– 工具使用类似工匠挑选工具
– 规划是前瞻性的艺术
– 多代理协作像小组合作
– 工作流编排架构模式
– 包括 Agent 层、记忆层、技能层、知识层
– 商业应用和开源案例
– 如字节扣子等,开源项目如 Dify 等
思维导图:
文章地址:https://mp.weixin.qq.com/s/e73zBj0rUcJCkikPX_m7_A
文章来源:mp.weixin.qq.com
作者:山行AI
发布时间:2024/7/15 3:54
语言:中文
总字数:2357字
预计阅读时间:10分钟
评分:90分
标签:Agentic Workflow,AI开发,多代理协作,工具使用,规划
以下为原文内容
本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com
简介
人工智能正在演变成我们数字生活中的一个动态伙伴。这一技术潮流中的最新浪潮是“代理工作流”——一种复杂但易于理解的人工智能方法,承诺提升我们的数字效率。这一创新邀请我们与人工智能进行互动舞蹈,在每一步中学习、适应,并随着每一个动作变得更聪明。
Agentic Workflow中的设计模式
为了理解代理工作流(Agentic Workflow)的细微差别,我们来分解这些高级系统的关键设计模式,它们构成了这些系统的基础。
1. Reflection(反思)
就像照镜子一样,人工智能代理现在可以审视自己的行为,学习并优化其反应。这就像与一个记得过去讨论并每次都变得更智慧的人进行对话。反思在根本上其实是一个博弈的过程:如果你让大模型写一段代码,它会立刻给你反馈。这时你可以将它输出的代码片段再输入回去,让大模型仔细检查代码的准确性和结构规范性,并给出评论。然后,你可以将这些反馈结果再次输入给大模型,它可能会输出一个比第一版更好的代码,如果有两个 Agent:一个负责 Coding,另一个负责 Code Review,效果会更佳。和人类的反思一样,Agentic Workflow的反思也是一个对历史回复内容的不断地自我修正的过程。
2. Tool Use(工具使用)
想象一下,人工智能就像一个技艺精湛的工匠,拥有一个工具箱。每一个工具,无论是网络搜索还是代码执行功能,都是精确挑选的,贡献于更准确和有效的结果。
工具可以包装成插件在工作流中使用,在扣子、百炼等平台上就是这样处理的。有些同学分不清Tool和插件的区别,这里说明一下:
例如,一个天气查询的 API Service 可能会包含以下两个 API:
•查询当前天气:http://api.weather.com/current•查询未来天气:http://api.weather.com/forecast
那么在创建插件时,每个 API 就是一个插件下的一个工具。
插件是一个工具集,一个插件内可以包含一个或多个工具(API)。它可以包括资讯阅读、旅游出行、效率办公、图片理解等 API 及多模态模型。使用这些插件,可以帮助您拓展 Bot 能力边界。例如,在您的 Bot 内添加新闻搜索插件,那么您的 Bot 将拥有搜索新闻资讯的能力。
在垂类应用中,可以把以往的技术中台api作为工具封装成插件,应用于垂类的Agentic Workflow中。
3. Planning(规划)
在人工智能中,规划是一种前瞻性的艺术。在这里,人工智能预见需求,规划出实现这些需求的步骤,并像一个细致入微的活动组织者一样执行计划,确保每一个细节都完美无缺。规划的核心是一个编排的过程,将记忆、技能和知识组装到一个或多个流程里,供单Agent或多Agent使用。
4. Multi-agent Collaboration(多代理协作)
想象一个每个成员都带来独特技能的小组项目。人工智能代理现在可以以类似的方式协作,每个代理从设计师到测试员都发挥自己的作用,以实现最佳结果。
(1)单Agent工作流
单Agent工作流模式适用于 Bot 技能非常明确的场景,在该模式下,Bot 用户的所有对话均会触发固定的工作流处理。工作流模式适用于 Bot 技能流程相对固定的场景,例如售后服务场景下指定某个工作流处理咨询问题、长文生成场景下根据用户的每个query分段生成内容。例如:
•对于文章生成类型的 Bot,添加一个生成短篇文章的工作流,通过第一个 LLM 生成大纲,第二个 LLM 生成第一段,作为上下文再生成第二段。•对于游戏类型的 Bot,将剧情物料制作成工作流,根据用户的 Query 匹配不同的剧情节点,通过多轮交互完成游戏。
(2)多Agent工作流
多 Agent 模式下您可以为 Bot 添加多个 Agent,并连接、配置各个 Agent 节点,通过多节点之间的分工协作来高效解决复杂的用户任务。
多 Agent 模式通过以下方式来简化复杂的任务场景。
•您可以为不同的 Agent 配置独立的提示词,将复杂任务分解为一组简单任务,而不是在一个 Bot 的提示词中设置处理任务所需的所有判断条件和使用限制。•多 Agent 模式允许您为每个 Agent 节点配置独立的插件和工作流。这不仅降低了单个 Agent 的复杂性,还提高了测试 Bot 时 bug 修复的效率和准确性,您只需要修改发生错误的 Agent 配置即可。
这些设计模式为人工智能提供了一个框架,使其不仅仅作为工具,而是作为问题解决的伙伴。它们被设计得用户友好,即使是人工智能新手也能与先进技术互动并受益。
这些不仅仅是理论概念。它们正在软件开发中被用来自动化和增强编码,带来更快更好的软件。这就像有一个助理,不仅能做笔记,还能提供改进工作的见解。
整体架构
工作流编排架构模式是一种用于设计和管理复杂业务流程的架构方式。它通过定义、执行、监控和优化业务流程,帮助组织高效地管理和协调各种任务和活动。
1.Agent层:用于定义Agent,可以是单个Agent,也可以是多个Agent组成的Multi-Agent;2.记忆层:用于维持青芽的长短期记忆能力,会在上下文环境中携带;3.技能层(Skills层):青芽的实际技能工作箱,包括插件、工作流、触发器和各类大模型;4.知识层:属于本地知识库的部分,也包括各类行业相关知识库,用于限定青芽回答的范围。Agentic Workflow象征着一个未来,在这个未来里,人工智能不仅仅是响应者,而是思考者和行动者。通过拥抱这些工作流,我们打开了通向创新人工智能合作的大门,这些合作曾经只是科幻领域的东西。
商业应用案例
这里就不展开来讲了,相信很多大家都已经用过,如字节扣子、阿里云百炼、天工、百度如流、讯飞星火等都是做的比较好的。
开源案例
Dify —一款开源的LLM工作流编排引擎
RAGFlow —一个开源的 RAG(检索增强生成)引擎
开源AI知识库系列之第四篇FastGpt
Flowise——通过拖放界面构建定制的LLM流程
LangFlow——一款可轻松实验和原型化 LangChain流水线的AI项目
ComfyUI等。
开源的Agent项目案例:现有的AI Agents有哪些,你知道吗?