编辑
2026-01-13
ai智能体
00

目录

前言
第一章
什么是智能体
传统智能体与现代智能体
AI的分类
智能体运行机制
智能体的感知和行动
构建一个简单的智能体
第二章
符号系统
联结主义

前言

学习GitHub上面hello agents的教程,我决定在这篇blog做一些这方面的笔记

第一章

什么是智能体

在人工智能领域,智能体被定义为任何能够通过传感器(Sensors)感知其所处环境(Environment),并自主地通过执行器(Actuators)采取行动(Action)以达成特定目标的实体。

传统智能体与现代智能体

image.png

AI的分类

image.png

智能体运行机制

image.png 这个循环主要包含以下几个相互关联的阶段:

  1. 感知 (Perception):这是循环的起点。智能体通过其传感器(例如,API 的监听端口、用户输入接口)接收来自环境的输入信息。这些信息,即观察 (Observation),既可以是用户的初始指令,也可以是上一步行动所导致的环境状态变化反馈。
  2. 思考 (Thought):接收到观察信息后,智能体进入其核心决策阶段。对于 LLM 智能体而言,这通常是由大语言模型驱动的内部推理过程。如图所示,“思考”阶段可进一步细分为两个关键环节:
    1. 规划 (Planning):智能体基于当前的观察和其内部记忆,更新对任务和环境的理解,并制定或调整一个行动计划。这可能涉及将复杂目标分解为一系列更具体的子任务。
    2. 工具选择 (Tool Selection):根据当前计划,智能体从其可用的工具库中,选择最适合执行下一步骤的工具,并确定调用该工具所需的具体参数。
  3. 行动 (Action):决策完成后,智能体通过其执行器(Actuators)执行具体的行动。这通常表现为调用一个选定的工具(如代码解释器、搜索引擎 API),从而对环境施加影响,意图改变环境的状态。
    行动并非循环的终点。智能体的行动会引起环境 (Environment) 的状态变化 (State Change),环境随即会产生一个新的观察 (Observation) 作为结果反馈。这个新的观察又会在下一轮循环中被智能体的感知系统捕获,形成一个持续的“感知-思考-行动-观察”的闭环。智能体正是通过不断重复这一循环,逐步推进任务,从初始状态向目标状态演进。

智能体的感知和行动

为了让智能体严格的执行上面的循环,我们需要一套明确的交互协议 (Interaction Protocol) 来规范其与环境之间的信息交换。 这个结构通常包含两个核心部分:

  • Thought (思考):这是智能体内部决策的“快照”。它以自然语言形式阐述了智能体如何分析当前情境、回顾上一步的观察结果、进行自我反思与问题分解,并最终规划出下一步的具体行动。
  • Action (行动):这是智能体基于思考后,决定对环境施加的具体操作,通常以函数调用的形式表示。
  • Observation(观察): 扮演传感器的角色,将原始输出处理并封装成一段简洁、清晰的自然语言文本。

构建一个简单的智能体

第二章

符号系统

  1. SHRDLU的历史地位与影响主要体现在三个方面:
  • 综合性智能的典范:在SHRDLU之前,AI研究大多聚焦于单一功能。它首次将语言理解、推理规划与行动记忆等多个AI模块集成于统一系统,其“感知-思考-行动”的闭环设计,奠定了现代智能体研究的基础。
  • 微观世界研究方法的普及:它的成功证明了在一个规则明确的简化环境中,探索和验证复杂智能体基本原理的可行性,这一方法深刻影响了后续的机器人学与AI规划研究。
  • 引发的乐观与反思:SHRDLU的成功激发了对AGI的早期乐观预期,但其能力又严格局限于积木世界。这种局限性引发了AI领域关于“符号处理”与“真正理解”之间差异的长期思辨,揭示了通往通用智能的深层挑战。
  1. 符号系统的缺陷:
  • 常识知识与知识获取瓶颈
  • 框架问题与系统脆弱性

联结主义

联结主义是一种自下而上的方法,其灵感来源于对生物大脑神经网络结构的模仿。它的核心思想可以概括为以下几点

  1. 知识的分布式表示:知识并非以明确的符号或规则形式存储在某个知识库中,而是以连接权重的形式,分布式地存储在大量简单的处理单元(即人工神经元)的连接之间。整个网络的连接模式本身就构成了知识。
  2. 简单的处理单元:每个神经元只执行非常简单的计算,如接收来自其他神经元的加权输入,通过一个激活函数进行处理,然后将结果输出给下一个神经元。
  3. 通过学习调整权重:系统的智能并非来自于设计者预先编写的复杂程序,而是来自于“学习”过程。系统通过接触大量样本,根据某种学习算法(如反向传播算法)自动、迭代地调整神经元之间的连接权重,从而使得整个网络的输出逐渐接近期望的目标。

image.png

本文作者:Deshill

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!