Agent的前世今生
Agent的由来
符号主义 AI(Symbolic AI),常被称为传统人工智能,其核心信念是:智能源于对符号的逻辑操作。这里的符号是人类可读的实体(如词语、概念),操作则遵循严格的逻辑规则。 其主要优势在于透明和可解释。由于推理步骤明确,其决策过程可以被完整追溯,这在金融、医疗等高风险领域至关重要。然而,其“阿喀琉斯之踵”在于脆弱性:它依赖于一个完备的规则体系,但在充满模糊和例外的现实世界中,任何未被覆盖的新情况都可能导致系统失灵,这就是所谓的“知识获取瓶颈”。
亚符号主义 AI(Sub-symbolic AI),或称连接主义,则认为知识并非显式的规则,而是内隐地分布在一个由大量神经元组成的复杂网络中,是从海量数据中学习到的统计模式。神经网络和深度学习是其代表。 他不是通过学习“猫有四条腿、毛茸茸、会喵喵叫”这样的规则来认识猫的,而是在看过成千上万张猫的图片后,大脑中的神经网络能辨识出“猫”这个概念的视觉模式 。这种方法的强大之处在于其模式识别能力和对噪声数据的鲁棒性 。它能够轻松处理图像、声音等非结构化数据,这在符号主义 AI 看来是极其困难的任务。 然而,这种强大的直觉能力也伴随着不透明性。亚符号主义系统通常被视为一个黑箱(Black Box)。它能以惊人的准确率识别出图片中的猫,但你若问它“为什么你认为这是猫?”,它很可能无法给出一个合乎逻辑的解释。此外,它在纯粹的逻辑推理任务上表现不佳,有时会产生看似合理却事实错误的幻觉 。
符号主义试图将人类的知识显式地编码给机器,而联结主义则试图创造出能够像人类一样学习知识的机器。
长久以来,符号主义和亚符号主义这两大阵营如同两条平行线,各自发展。为克服上述两种范式的局限,一种“大和解”的思想开始兴起,这就是神经符号主义 AI(Neuro-Symbolic AI),也称神经符号混合主义。它的目标,是融合两大范式的优点,创造出一个既能像神经网络一样从数据中学习,又能像符号系统一样进行逻辑推理的混合智能体。它试图弥合感知与认知、直觉与理性之间的鸿沟。 大语言模型驱动的智能体是神经符号主义的一个极佳实践范例。其内核是一个巨大的神经网络,使其具备模式识别和语言生成能力。然而,当它工作时,它会生成一系列结构化的中间步骤,如思想、计划或 API 调用,这些都是明确的、可操作的符号。通过这种方式,它实现了感知与认知、直觉与理性的初步融合。
符号主义、亚符号主义与神经符号混合主义的知识表示范式:

Agent的分类

Agent VS Workflow
尽管Workflow 和 Agent 都旨在实现任务自动化,但其底层逻辑、核心特征和适用场景却截然不同。
简单来说,Workflow 是让 AI 按部就班地执行指令,而 Agent 则是赋予 AI 自由度去自主达成目标。在 AIWorkflow 中 LLM 只是一个节点,它只能盘活一个节点,主导的还是机械化代码,LLM 只是辅助。而在 AIAgent 中 LLM 作为主导,自主判断是否调用工具(机械化代码),主导的是LLM,机械化代码只是辅助。

如图所示,工作流是一种传统的自动化范式,其核心是对一系列任务或步骤进行预先定义的、结构化的编排。它本质上是一个精确的、静态的流程图,规定了在何种条件下、以何种顺序执行哪些操作。整个过程的每一步、每一个判断条件都被精确地预先设定。(符号主义 我们传统的编程思维)
与工作流不同,基于大型语言模型的智能体是一个具备自主性的、以目标为导向的系统。它不仅仅是执行预设指令,而是能够在一定程度上理解环境、进行推理、制定计划,并动态地采取行动以达成最终目标。LLM 在其中扮演着“大脑”的角色。一个典型的例子,便是我们创建的智能旅行助手 Nova 。当我们向它下达一个新指令,例如:“明天我要去邵阳,有什么推荐景点吗?” 它的处理过程充分展现了其自主性:
- 规划与工具调用: Agent 首先会把任务拆解为两个步骤:① 查询天气;② 基于天气推荐景点。随即,它会自主选择并调用“天气查询 API”,并将“邵阳”作为参数传入。(注意在 Nova 的测试案例中,我们也并没有规定要“先查天气”,甚至也没有“要查天气”的指示,这都是 Nova 自主决策的结果)
- 推理与决策: 假设 API 返回结果为“阴天”。Agent 的 LLM 大脑会基于这个信息进行推理:“需要搜索适合阴天游玩的邵阳景点”。接着,它会根据这个判断,在它的知识库中或再调用其它的搜索引擎工具,筛选出符合要求的景点,如瑶寨、白水洞等。
- 生成结果: 最后,Agent 会综合信息,给出一个完整的、人性化的回答:“根据查询结果,邵阳明天是阴天,气温11摄氏度。在这样的天气条件下,我为您推荐游览瑶寨。瑶寨在阴天时景色宁静,非常适合摄影和放松,特别是其独特的丹霞地貌在阴天会显得格外迷人。祝您旅途愉快!”
在这个过程中,没有任何写死的if天气=阴天 then 推荐瑶寨的规则。如果天气是“晴天”,Agent 会自主推理并调用合适的工具,最终可能会推荐崀山、南山牧场等景点。这种基于实时信息进行动态推理和决策的能力,正是 Agent 的核心价值所在。
Agent的发展
前置知识了解:
符号主义:专家系统、SHRDLU、ELIZA、“深蓝”计算机
过度时期:“心智社会”理论(去中心化)
联结主义:机器学习/深度学习、反向传播算法、卷积神经网络、Transformer模型
行为主义:强化学习、TD-Gammon、AIphaGo
概念区分:
机器学习/深度学习:静态数据集-预训练(背景知识)-微调(专业知识)-感知问题-学习能力)
强化学习:环境交互数据-专业知识-决策问题-决策能力)
智能体发展演进时间线(未完全版):

AI Agent 技术栈概览:

现代Agent的基础架构
LLM驱动的智能体核心组件架构:
