功能概览

Hermes Agent 拥有丰富的功能集，远超基础对话能力。从持久记忆（Memory）和文件感知上下文到浏览器自动化和语音对话，这些功能协同工作，使 Hermes 成为强大的自主助手。

核心

工具与工具集（Tools & Toolsets） — 工具是扩展代理能力的函数。它们被组织为逻辑工具集，可按平台启用或禁用，涵盖网络搜索、终端执行、文件编辑、记忆、委派等。
技能系统（Skills System） — 按需加载的知识文档。技能遵循渐进式披露（Progressive Disclosure）模式以最小化 token 消耗，并兼容 agentskills.io 开放标准。
持久记忆（Persistent Memory） — 跨会话持久化的有限策展记忆。Hermes 通过 MEMORY.md 和 USER.md 记住您的偏好、项目、环境以及已学内容。
上下文文件（Context Files） — Hermes 自动发现并加载项目上下文文件（.hermes.md、AGENTS.md、CLAUDE.md、SOUL.md、.cursorrules），这些文件塑造其行为。
上下文引用（Context References） — 输入 @ 后跟引用，将文件、文件夹、git diff 和 URL 直接注入消息中。Hermes 内联展开引用并自动追加内容。
检查点（Checkpoints） — Hermes 在修改文件前自动快照工作目录，若出现问题可通过 /rollback 回滚，提供安全网。

自动化

Cron） — 使用自然语言或 cron 表达式自动运行任务。任务可附加技能、将结果投递到任何平台，并支持暂停/恢复/编辑操作。
子代理委派（Subagent Delegation） — delegate_task 工具生成具有隔离上下文、受限工具集和独立终端会话的子代理实例。默认支持 3 个并行子代理（可配置），实现并行工作流。
代码执行（Code Execution） — execute_code 工具允许代理编写 Python 脚本并以编程方式调用 Hermes 工具，通过沙箱 RPC 执行将多步骤工作流压缩为单个 LLM 轮次。
事件钩子（Event Hooks） — 在关键生命周期点运行自定义代码。网关钩子处理日志、告警和 Webhook；插件钩子处理工具拦截、指标和安全护栏。
批处理（Batch Processing） — 在数百或数千个提示上并行运行 Hermes 代理，生成结构化 ShareGPT 格式轨迹数据，用于训练数据生成或评估。

媒体与网络

语音模式（Voice Mode） — 跨 CLI 和消息平台的完整语音交互。使用麦克风与代理对话、收听语音回复，并在 Discord 语音频道中进行实时语音对话。
浏览器自动化（Browser Automation） — 完整的浏览器自动化，支持多个后端：Browserbase 云、Browser Use 云、本地 Chrome/Brave/Chromium/Edge（通过 CDP）或本地 Chromium。可导航网站、填写表单和提取信息。
视觉与图片粘贴（Vision & Image Paste） — 多模态视觉支持。从剪贴板粘贴图片到 CLI，让代理使用任何支持视觉的模型进行分析、描述或处理。
图片生成（Image Generation） — 使用 FAL.ai 从文本提示生成图片。支持九种模型（FLUX 2 Klein/Pro、GPT-Image 1.5/2、Nano Banana Pro、Ideogram V3、Recraft V4 Pro、Qwen、Z-Image Turbo）；通过 hermes tools 选择。
语音与 TTS — 跨所有消息平台的文本转语音输出和语音消息转录，支持十个原生提供商：Edge TTS（免费）、ElevenLabs、OpenAI TTS、MiniMax、Mistral Voxtral、Google Gemini、xAI、NeuTTS、KittenTTS 和 Piper——以及自定义命令提供商，适用于任何本地 TTS CLI。

集成

MCP 集成 — 通过 stdio 或 HTTP 传输连接到任何 MCP 服务器。无需编写原生 Hermes 工具即可访问来自 GitHub、数据库、文件系统和内部 API 的外部工具。支持每服务器工具过滤和采样（Sampling）。
提供商路由（Provider Routing） — 精细控制哪些 AI 提供商处理您的请求。通过排序、白名单、黑名单和优先级排序，优化成本、速度或质量。
后备提供商（Fallback Providers） — 当主模型遇到错误时自动故障转移到备用 LLM 提供商，包括视觉和压缩等辅助任务的独立故障转移。
凭证池（Credential Pools） — 将 API 调用分配到同一提供商的多个密钥中。遇到速率限制或失败时自动轮换。
提示缓存（Prompt Caching） — 内置跨会话 1 小时前缀缓存，适用于 Anthropic、OpenRouter 和 Nous Portal 上的 Claude。始终开启，无需配置。
记忆提供商（Memory Providers） — 插入外部记忆后端（Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover、Supermemory），实现超越内置记忆系统的跨会话用户建模和个性化。
API 服务器（API Server） — 将 Hermes 暴露为兼容 OpenAI 的 HTTP 端点。连接任何使用 OpenAI 格式的前端——Open WebUI、LobeChat、LibreChat 等。
IDE 集成 (ACP) — 在兼容 ACP 的编辑器（如 VS Code、Zed 和 JetBrains）中使用 Hermes。聊天、工具活动、文件 diff 和终端命令均在编辑器内渲染。
强化学习训练（RL Training） — 从代理会话生成轨迹数据，用于强化学习和模型微调。

自定义

个性与 SOUL.md — 完全可定制的代理个性。SOUL.md 是主要身份文件——系统提示中的第一项——您可以在每个会话中切换内置或自定义 /personality 预设。
皮肤与主题（Skins & Themes） — 自定义 CLI 的视觉呈现：横幅颜色、旋转器图标和动词、回复框标签、品牌文本以及工具活动前缀。
插件（Plugins） — 无需修改核心代码即可添加自定义工具、钩子和集成。三种插件类型：通用插件（工具/钩子）、记忆提供商（跨会话知识）和上下文引擎（替代上下文管理）。通过统一的 hermes plugins 交互式 UI 管理。

好奇心花园🪴

探索

最近的笔记

note-template

getMoon.js

getWeather.js

功能概览

功能概览

核心

自动化

媒体与网络

集成

自定义

关系图谱

目录

反向链接