工具运行时

Hermes 工具是自注册的函数,分组为工具集(toolsets),并通过中心化的注册表/分发系统执行。

主要文件:

  • tools/registry.py
  • model_tools.py
  • toolsets.py
  • tools/terminal_tool.py
  • tools/environments/*

工具注册模型

每个工具模块在导入时调用 registry.register(...)

model_tools.py 负责导入/发现工具模块,并构建模型使用的模式列表。

registry.register() 的工作原理

tools/ 中的每个工具文件在模块级别调用 registry.register() 来声明自己。函数签名为:

registry.register(
    name="terminal",               # 唯一工具名称(用于 API 模式)
    toolset="terminal",            # 此工具所属的工具集
    schema={...},                  # OpenAI 函数调用模式(描述、参数)
    handler=handle_terminal,       # 工具被调用时执行的函数
    check_fn=check_terminal,       # 可选:返回 True/False 表示是否可用
    requires_env=["SOME_VAR"],     # 可选:所需的环境变量(用于 UI 展示)
    is_async=False,                # 处理函数是否为异步协程
    description="Run commands",    # 人类可读的描述
    emoji="💻",                    # 旋转/进度显示用的表情符号
)

每次调用创建一个 ToolEntry,存储在单例 ToolRegistry._tools 字典中,以工具名称为键。如果跨工具集发生名称冲突,会记录警告,后注册的获胜。

发现:discover_builtin_tools()

当导入 model_tools.py 时,它会调用 tools/registry.py 中的 discover_builtin_tools()。该函数使用 AST 解析扫描每个 tools/*.py 文件,查找包含顶级 registry.register() 调用的模块,然后导入它们:

# tools/registry.py(简化版)
def discover_builtin_tools(tools_dir=None):
    tools_path = Path(tools_dir) if tools_dir else Path(__file__).parent
    for path in sorted(tools_path.glob("*.py")):
        if path.name in {"__init__.py", "registry.py", "mcp_tool.py"}:
            continue
        if _module_registers_tools(path):  # AST 检查顶级 registry.register()
            importlib.import_module(f"tools.{path.stem}")

这种自动发现意味着新工具文件会被自动识别——无需维护手动列表。AST 检查仅匹配顶级 registry.register() 调用(不匹配函数内部的调用),因此 tools/ 中的辅助模块不会被导入。

每次导入触发模块的 registry.register() 调用。可选工具中的错误(例如缺少图像生成的 fal_client)会被捕获并记录——不影响其他工具的加载。

核心工具发现之后,MCP 工具和插件工具也会被发现:

  1. MCP 工具tools.mcp_tool.discover_mcp_tools() 读取 MCP 服务器配置并从外部服务器注册工具。
  2. 插件工具hermes_cli.plugins.discover_plugins() 加载用户/项目/pip 插件,这些插件可能注册额外的工具。

工具可用性检查(check_fn

每个工具可以可选地提供一个 check_fn——一个可调用对象,工具可用时返回 True,否则返回 False。典型检查包括:

  • API 密钥存在 — 例如,网页搜索的 lambda: bool(os.environ.get("SERP_API_KEY"))
  • 服务运行中 — 例如,检查 Honcho 服务器是否已配置
  • 二进制文件已安装 — 例如,验证 playwright 是否可用于浏览器工具

registry.get_definitions() 为模型构建模式列表时,它会运行每个工具的 check_fn()

# 从 registry.py 简化
if entry.check_fn:
    try:
        available = bool(entry.check_fn())
    except Exception:
        available = False   # 异常 = 不可用
    if not available:
        continue            # 完全跳过此工具

关键行为:

  • 检查结果每次调用缓存——如果多个工具共享同一个 check_fn,它只运行一次。
  • check_fn() 中的异常被视为”不可用”(故障安全)。
  • is_toolset_available() 方法检查工具集的 check_fn 是否通过,用于 UI 展示和工具集解析。

工具集解析

工具集(Toolsets)是命名的工具包。Hermes 通过以下方式解析它们:

  • 显式的启用/禁用工具集列表
  • 平台预设(hermes-clihermes-telegram 等)
  • 动态 MCP 工具集
  • 策划的特殊用途集,如 hermes-acp

get_tool_definitions() 如何筛选工具

主要入口点是 model_tools.get_tool_definitions(enabled_toolsets, disabled_toolsets, quiet_mode)

  1. 如果提供了 enabled_toolsets — 仅包含来自这些工具集的工具。每个工具集名称通过 resolve_toolset() 解析,后者将复合工具集展开为单独的工具名称。

  2. 如果提供了 disabled_toolsets — 从所有工具集开始,然后减去禁用的工具集。

  3. 如果两者都未提供 — 包含所有已知工具集。

  4. 注册表筛选 — 解析后的工具名称集合传递给 registry.get_definitions(),后者应用 check_fn 筛选并返回 OpenAI 格式的模式。

  5. 动态模式修补 — 筛选后,execute_codebrowser_navigate 的模式会动态调整,仅引用实际通过筛选的工具(防止模型幻觉使用不可用的工具)。

传统工具集名称

带有 _tools 后缀的旧工具集名称(例如 web_toolsterminal_tools)通过 _LEGACY_TOOLSET_MAP 映射到其现代工具名称,以保持向后兼容性。

分发

在运行时,工具通过中心注册表分发,但代理循环级别的某些工具(如 memory/todo/session-search 处理)有例外。

分发流程:模型 tool_call → 处理函数执行

当模型返回 tool_call 时,流程如下:

模型响应中包含 tool_call
    ↓
run_agent.py 代理循环
    ↓
model_tools.handle_function_call(name, args, task_id, user_task)
    ↓
[代理循环工具?] → 由代理循环直接处理(todo、memory、session_search、delegate_task)
    ↓
[插件前置钩子] → invoke_hook("pre_tool_call", ...)
    ↓
registry.dispatch(name, args, **kwargs)
    ↓
按名称查找 ToolEntry
    ↓
[异步处理函数?] → 通过 _run_async() 桥接
[同步处理函数?] → 直接调用
    ↓
返回结果字符串(或 JSON 错误)
    ↓
[插件后置钩子] → invoke_hook("post_tool_call", ...)

错误包装

所有工具执行在两个层面进行错误包装:

  1. registry.dispatch() — 捕获处理函数中的任何异常,并返回 JSON 格式的 {"error": "Tool execution failed: ExceptionType: message"}

  2. handle_function_call() — 将整个分发包裹在二级 try/except 中,返回 {"error": "Error executing tool_name: message"}

这确保了模型始终接收到格式良好的 JSON 字符串,绝不会遇到未处理的异常。

代理循环工具

四个工具在注册表分发之前被拦截,因为它们需要代理级别的状态(TodoStore、MemoryStore 等):

  • todo — 规划/任务跟踪
  • memory — 持久化内存写入
  • session_search — 跨会话回忆
  • delegate_task — 生成子代理会话

这些工具的模式仍然在注册表中注册(用于 get_tool_definitions),但如果分发直接到达它们的处理函数,则会返回一个桩错误。

异步桥接

当工具处理函数是异步时,_run_async() 将其桥接到同步分发路径:

  • CLI 路径(无运行中循环) — 使用持久事件循环保持缓存的异步客户端存活
  • Gateway 路径(有运行中循环) — 使用 asyncio.run() 启动一次性线程
  • 工作线程(并行工具) — 使用线程本地存储中的每线程持久循环

DANGEROUS_PATTERNS 审批流程

终端工具集成了一个危险命令审批系统,定义在 tools/approval.py 中:

  1. 模式检测DANGEROUS_PATTERNS 是一个 (regex, description) 元组列表,覆盖破坏性操作:

    • 递归删除(rm -rf
    • 文件系统格式化(mkfsdd
    • SQL 破坏性操作(DROP TABLE、不带 WHEREDELETE FROM
    • 系统配置覆盖(> /etc/
    • 服务操作(systemctl stop
    • 远程代码执行(curl | sh
    • Fork 炸弹、进程杀死等
  2. 检测 — 在执行任何终端命令之前,detect_dangerous_command(command) 检查所有模式。

  3. 审批提示 — 如果发现匹配:

    • CLI 模式 — 交互式提示要求用户批准、拒绝或永久允许
    • Gateway 模式 — 异步审批回调将请求发送到消息平台
    • 智能审批 — 可选地,辅助 LLM 可以自动批准匹配模式但风险较低的命令(例如 rm -rf node_modules/ 是安全的,但匹配”递归删除”模式)
  4. 会话状态 — 审批按会话跟踪。一旦你批准了某个会话的”递归删除”,后续的 rm -rf 命令不再重新提示。

  5. 永久允许列表 — “永久允许”选项将模式写入 config.yamlcommand_allowlist,跨会话持久化。

终端/运行时环境

终端系统支持多个后端:

  • local(本地)
  • docker(Docker)
  • ssh(SSH)
  • singularity(Singularity)
  • modal(Modal)
  • daytona(Daytona)
  • vercel_sandbox(Vercel Sandbox)

它还支持:

  • 每任务工作目录覆盖
  • 后台进程管理
  • PTY 模式
  • 危险命令的审批回调

并发

工具调用可以顺序或并发执行,取决于工具组合和交互需求。

相关文档