可选技能目录

可选技能随 hermes-agent 发布在 optional-skills/ 目录下，但默认不启用。需要显式安装：

hermes skills install official/<category>/<skill>

例如：

hermes skills install official/blockchain/solana
hermes skills install official/mlops/flash-attention

下面的每个技能都链接到专门的页面，包含完整的定义、设置和使用说明。

卸载方法：

hermes skills uninstall <skill-name>

autonomous-ai-agents（自主 AI 代理）

技能	描述
blackbox	将编码任务委托给 Blackbox AI CLI 代理。多模型代理，内置评审机制，通过多个 LLM 运行任务并选择最佳结果。需要 blackbox CLI 和 Blackbox AI API 密钥。
honcho	配置并在 Hermes 中使用 Honcho 记忆——跨会话用户建模、多配置文件对等隔离、观察配置、辩证推理、会话摘要和上下文预算执行。用于设置 Honcho、故障排除时使用……

blockchain（区块链）

技能	描述
evm	只读 EVM 客户端：跨 8 条链的钱包、代币、Gas。
hyperliquid	Hyperliquid 市场数据、账户历史、交易回顾。
solana	使用美元定价查询 Solana 区块链数据——钱包余额、带价值的代币组合、交易详情、NFT、大户检测和实时网络状态。使用 Solana RPC + CoinGecko。无需 API 密钥。

communication（沟通）

技能	描述
one-three-one-rule	面向技术方案和权衡分析的结构化决策框架。当用户面临多个方案之间的选择时（架构决策、工具选择、重构策略、迁移路径），该技能会……

creative（创意）

技能	描述
blender-mcp	通过 socket 连接到 blender-mcp 插件，直接从 Hermes 控制 Blender。创建 3D 对象、材质、动画，并运行任意 Blender Python（bpy）代码。用户想要在 Blender 中创建或修改任何内容时使用。
concept-diagrams	生成扁平、极简、明/暗模式感知的 SVG 图表，作为独立 HTML 文件。使用统一的视觉教学语言，包含 9 种语义颜色渐变、句首大写排版和自动暗色模式。最适合教育和概念……
hyperframes	使用 HyperFrames 创建基于 HTML 的视频合成、动画标题卡、社交覆盖层、带字幕的说话头视频、音频响应式视觉效果和着色器转场。HTML 是视频的唯一数据源。当用户想要……时使用。
kanban-video-orchestrator	使用 Hermes Kanban 规划、设置和监控多代理视频制作流水线。当用户想要制作任何视频时使用——叙事电影、产品/营销视频、音乐视频、解说视频、ASCII/终端艺术、抽象/生成风格……
meme-generation	通过选择模板并使用 Pillow 叠加文本来生成真实的梗图。生成实际的 .png 梗图文件。

devops（运维）

技能	描述
inference-sh-cli	通过 inference.sh CLI（infsh）运行 150+ AI 应用——图像生成、视频创建、LLM、搜索、3D、社交自动化。使用 terminal 工具。触发关键词：inference.sh、infsh、AI apps、flux、veo、图像生成、视频生成、seedrea……
docker-management	管理 Docker 容器、镜像、卷、网络和 Compose 堆栈——生命周期操作、调试、清理和 Dockerfile 优化。
pinggy-tunnel	通过 Pinggy 实现零安装的 localhost SSH 隧道。
watchers	使用水印去重轮询 RSS、JSON API 和 GitHub。

dogfood（内部测试）

技能	描述
adversarial-ux-test	扮演你的产品最难缠、最抵触技术的用户角色。以该角色浏览应用，找出每一个 UX 痛点，然后通过实用主义层过滤投诉，将真正的问题与噪音区分开来。创建可操作的问题卡片……

email（邮件）

技能	描述
agentmail	通过 AgentMail 为代理提供专属邮件收件箱。使用代理拥有的邮件地址（如 hermes-agent@agentmail.to）自主发送、接收和管理邮件。

finance（金融）

技能	描述
3-statement-model	在 Excel 中构建完全集成的三表模型（利润表、资产负债表、现金流量表），包含营运资本计划、折旧摊销滚动、债务计划和使现金及留存收益平衡的勾稽项。与 excel-author 配合使用。
comps-analysis	在 Excel 中构建可比公司分析——运营指标、估值倍数、与同行组的统计基准。与 excel-author 配合使用。用于上市公司估值、IPO 定价、行业基准检测或异常值检测。
dcf-model	在 Excel 中构建机构级 DCF 估值模型——收入预测、自由现金流构建、WACC、终值、悲观/基准/乐观情景、5x5 敏感性表。与 excel-author 配合使用。用于内在价值股权分析。
excel-author	使用 openpyxl 无头构建可审计的 Excel 工作簿——蓝/黑/绿色单元格约定、公式优先于硬编码、命名区域、平衡检查和敏感性表。用于财务模型、审计输出、对账。
lbo-model	在 Excel 中构建杠杆收购模型——资金来源与用途、债务计划、现金扫除、退出倍数、IRR/MOIC 敏感性。与 excel-author 配合使用。用于 PE 筛查、赞助方案估值或路演中的示意性 LBO。
merger-model	在 Excel 中构建增厚/稀释（合并）模型——备考利润表、协同效应、融资组合、每股收益影响。与 excel-author 配合使用。用于 M&A 路演、董事会材料或交易评估。
pptx-author	使用 python-pptx 无头构建 PowerPoint 幻灯片。与 excel-author 配合，为每个数字都可溯源到工作簿单元格的、由模型支撑的幻灯片使用。用于路演幻灯片、IC 备忘录、收益报告。
stocks	通过 Yahoo 获取股票报价、历史数据、搜索、比较和加密货币数据。

health（健康）

技能	描述
fitness-nutrition	健身房锻炼计划制定器和营养追踪器。通过 wger 按肌肉、器材或类别搜索 690+ 种锻炼。通过 USDA FoodData Central 查询 380,000+ 种食物的宏量和卡路里。计算 BMI、TDEE、最大重复次数、宏量营养素分配和身体……
neuroskill-bci	连接到正在运行的 NeuroSkill 实例，将用户的实时认知和情感状态（专注度、放松度、情绪、认知负荷、困倦度、心率、心率变异性、睡眠分期和 40+ 衍生 EXG 分数）融入响应中……

mcp（MCP）

技能	描述
fastmcp	使用 Python 中的 FastMCP 构建、测试、检查、安装和部署 MCP 服务器。在创建新的 MCP 服务器、将 API 或数据库封装为 MCP 工具、暴露资源或提示词、或为 Claude Code、Cur……准备 FastMCP 服务器时使用。
mcporter	使用 mcporter CLI 直接列出、配置、认证和调用 MCP 服务器/工具（HTTP 或 stdio），包括临时服务器、配置编辑和 CLI/类型生成。

migration（迁移）

技能	描述
openclaw-migration	将用户的 OpenClaw 自定义配置迁移到 Hermes Agent。导入 Hermes 兼容的记忆、SOUL.md、命令允许列表、用户技能以及来自 ~/.openclaw 的选定工作区资产，然后报告无法迁移的内容……

mlops（MLOps）

技能	描述
huggingface-accelerate	最简单的分布式训练 API。仅需 4 行代码即可为任何 PyTorch 脚本添加分布式支持。DeepSpeed/FSDP/Megatron/DDP 的统一 API。自动设备放置、混合精度（FP16/BF16/FP8）。交互式配置、单一启动命令……
axolotl	Axolotl：YAML 格式的 LLM 微调（LoRA、DPO、GRPO）。
chroma	面向 AI 应用的开源嵌入数据库。存储嵌入和元数据，执行向量和全文搜索，按元数据过滤。简单的 4 函数 API。从笔记本扩展到生产集群。用于语义搜索、RAG……
clip	OpenAI 连接视觉和语言的模型。实现零样本图像分类、图像-文本匹配和跨模态检索。在 4 亿图像-文本对上训练。用于图像搜索、内容审核或视觉-语言任务……
faiss	Facebook 的高效相似性搜索和稠密向量聚类库。支持数十亿向量、GPU 加速和多种索引类型（Flat、IVF、HNSW）。用于快速 k-NN 搜索、大规模向量检索或需……时使用。
optimizing-attention-flash	使用 Flash Attention 优化 Transformer 注意力机制，实现 2-4 倍加速和 10-20 倍内存减少。在训练/运行长序列（>512 token）的 Transformer、遇到注意力部分的 GPU 内存问题、或需要更快的推理……时使用。
guidance	使用正则表达式和语法控制 LLM 输出，保证有效的 JSON/XML/代码生成，强制执行结构化格式，并通过 Guidance（微软研究院的约束生成框架）构建多步骤工作流。
huggingface-tokenizers	面向研究和生产优化的快速分词器。基于 Rust 的实现可在 20 秒内完成 1GB 数据的分词。支持 BPE、WordPiece 和 Unigram 算法。训练自定义词汇表、跟踪对齐、处理填充/截断。集成……
instructor	使用 Pydantic 验证从 LLM 响应中提取结构化数据，自动重试失败的提取，使用类型安全解析复杂 JSON，并通过 Instructor（久经考验的结构化输出库）流式传输部分结果。
lambda-labs-gpu-cloud	用于 ML 训练和推理的预留和按需 GPU 云实例。当需要具有简单 SSH 访问、持久化文件系统或用于大规模训练的高性能多节点集群的专用 GPU 实例时使用。
llava	大型语言与视觉助手。实现视觉指令微调和基于图像的对话。结合了 CLIP 视觉编码器和 Vicuna/LLaMA 语言模型。支持多轮图像聊天、视觉问答和指令……
modal-serverless-gpu	用于运行 ML 工作负载的无服务器 GPU 云平台。当需要按需 GPU 访问而无需管理基础设施、将 ML 模型部署为 API、或运行具有自动扩展能力的批处理作业时使用。
nemo-curator	用于 LLM 训练的 GPU 加速数据整理。支持文本/图像/视频/音频。功能包括模糊去重（快 16 倍）、质量过滤（30+ 启发式规则）、语义去重、PII 脱敏、NSFW 检测。跨 GPU 扩展……
outlines	Outlines：结构化 JSON/正则表达式/Pydantic LLM 生成。
peft-fine-tuning	使用 LoRA、QLoRA 和 25+ 种方法的参数高效微调。当微调大模型（7B-70B）但 GPU 内存有限，或只需要训练 <1% 的参数且精度损失最小，或用于多适配器服务……时使用。
pinecone	面向生产 AI 应用的托管向量数据库。全托管、自动扩展、支持混合搜索（稠密 + 稀疏）、元数据过滤和命名空间。低延迟（p95 <100ms）。用于生产级 RAG、推荐系统或语……
pytorch-fsdp	使用 PyTorch FSDP 的全分片数据并行训练专家指南——参数分片、混合精度、CPU 卸载、FSDP2。
pytorch-lightning	高级 PyTorch 框架，包含 Trainer 类、自动分布式训练（DDP/FSDP/DeepSpeed）、回调系统和极简样板代码。使用相同代码从笔记本扩展到超级计算机。当你想要干净的训练循环……时使用。
qdrant-vector-search	面向 RAG 和语义搜索的高性能向量相似性搜索引擎。在构建需要快速最近邻搜索、带有过滤的混合搜索或 Rust 驱动的可扩展向量存储的生产级 RAG 系统时使用……
sparse-autoencoder-training	提供使用 SAELens 训练和分析稀疏自编码器的指导，将神经网络激活分解为可解释的特征。在发现可解释特征、分析叠加或研究……时使用。
simpo-training	用于 LLM 对齐的简单偏好优化。无需参考模型的 DPO 替代方案，性能更好（在 AlpacaEval 2.0 上提升 +6.4 分）。无需参考模型，比 DPO 更高效。当你想要简单的偏好对齐……时使用。
slime-rl-training	提供使用 slime（Megatron+SGLang 框架）进行 LLM 后训练的 RL 指导。在训练 GLM 模型、实现自定义数据生成工作流、或需要紧密的 Megatron-LM 集成进行 RL 扩展时使用。
stable-diffusion-image-generation	通过 HuggingFace Diffusers 使用 Stable Diffusion 模型进行最先进的文本到图像生成。在从文本提示生成图像、执行图像到图像转换、修复或构建自定义扩散流水线时使用。
tensorrt-llm	使用 NVIDIA TensorRT 优化 LLM 推理，实现最大吞吐量和最低延迟。用于 NVIDIA GPU（A100/H100）上的生产部署，当需要比 PyTorch 快 10-100 倍的推理速度，或服务使用量化……的模型时使用。
distributed-llm-pretraining-torchtitan	使用 torchtitan 进行 PyTorch 原生的分布式 LLM 预训练，支持 4D 并行（FSDP2、TP、PP、CP）。在从 8 到 512+ GPU 的规模下预训练 Llama 3.1、DeepSeek V3 或自定义模型时使用，支持 Float8、torch.compile 和分布式……
fine-tuning-with-trl	TRL：用于 LLM RLHF 的 SFT、DPO、PPO、GRPO、奖励建模。
unsloth	Unsloth：2-5 倍更快的 LoRA/QLoRA 微调，更少的 VRAM 消耗。
whisper	OpenAI 的通用语音识别模型。支持 99 种语言、转录、翻译为英语和语言识别。六种模型大小，从极小（3900 万参数）到极大（15.5 亿参数）。用于语音转文本、播客……

productivity（生产力）

技能	描述
canvas	Canvas LMS 集成——通过 API 令牌认证获取已选课程和作业。
here.now	将静态站点发布到 {slug}.here.now，并将私有文件存储在云盘中用于代理间交接。
memento-flashcards	间隔重复闪卡系统。从事实或文本创建卡片，使用由代理评分的自由文本答案与闪卡聊天，从 YouTube 转录生成测验，使用自适应调度复习到期卡片，以及导出/导入……
shop-app	Shop.app：产品搜索、订单跟踪、退货、重新下单。
shopify	通过 curl 使用的 Shopify Admin 和 Storefront GraphQL API。产品、订单、客户、库存、元字段。
siyuan	通过 curl 使用 SiYuan Note API 在自托管知识库中搜索、读取、创建和管理块和文档。
telephony	在不更改核心工具的情况下为 Hermes 提供电话能力。配置和持有一个 Twilio 号码，发送和接收 SMS/MMS，拨打电话，并通过 Bland.ai 或 Vapi 进行 AI 驱动的外呼电话。

research（研究）

技能	描述
bioinformatics	来自 bioSkills 和 ClawBio 的 400+ 生物信息学技能入口。涵盖基因组学、转录组学、单细胞、变异检测、药物基因组学、宏基因组学、结构生物学等。按需获取领域特定参考材料……
darwinian-evolver	使用 Imbue 的进化循环演化提示词/正则表达式/SQL/代码。
domain-intel	使用 Python 标准库进行被动域名侦察。子域名发现、SSL 证书检查、WHOIS 查询、DNS 记录、域名可用性检查和批量多域名分析。无需 API 密钥。
drug-discovery	用于药物发现工作流的药物研究助手。在 ChEMBL 上搜索生物活性化合物，计算药物相似性（Lipinski 五规则、QED、TPSA、合成可及性），通过 OpenFDA 查询药物相互作用，解读 ADMET……
duckduckgo-search	通过 DuckDuckGo 进行免费网络搜索——文本、新闻、图片、视频。无需 API 密钥。优先使用 `ddgs` CLI（如果已安装）；仅在验证 `ddgs` 在当前运行时可用后才使用 Python DDGS 库。
gitnexus-explorer	使用 GitNexus 索引代码库，并通过 Web UI + Cloudflare 隧道提供交互式知识图谱服务。
osint-investigation	公开记录 OSINT 调查框架——SEC EDGAR 文件、USAspending 合同、参议院游说、OFAC 制裁、ICIJ 离岸泄密、纽约市房产记录（ACRIS）、OpenCorporates 注册信息、CourtListener 法院记录、Wayback……
parallel-cli	Parallel CLI 的可选供应商技能——代理原生网络搜索、提取、深度研究、信息增强、FindAll 和监控。推荐 JSON 输出和非交互式流程。
qmd	使用 qmd 在本地搜索个人知识库、笔记、文档和会议转录——混合检索引擎，支持 BM25、向量搜索和 LLM 重排序。支持 CLI 和 MCP 集成。
scrapling	使用 Scrapling 进行网页抓取——HTTP 获取、隐身浏览器自动化、Cloudflare 绕过，以及通过 CLI 和 Python 进行的爬虫抓取。
searxng-search	通过 SearXNG 进行免费元搜索——聚合 70+ 搜索引擎的结果。可自托管或使用公共实例。无需 API 密钥。当网页搜索工具集不可用时自动回退。

security（安全）

技能	描述
1password	设置并使用 1Password CLI（op）。在安装 CLI、启用桌面应用集成、登录以及读取/注入命令密钥时使用。
oss-forensics	GitHub 仓库的供应链调查、证据恢复和取证分析。涵盖已删除提交恢复、强制推送检测、IOC 提取、多源证据收集、假设形成/验证和交……
sherlock	跨 400+ 社交网络的 OSINT 用户名搜索。通过用户名搜索社交媒体账户。

software-development（软件开发）

技能	描述
rest-graphql-debug	调试 REST/GraphQL API：状态码、认证、模式、复现。

web-development（Web 开发）

技能	描述
page-agent	将 alibaba/page-agent 嵌入到你的 Web 应用中——一个纯 JavaScript 的页面内 GUI 代理，以单个 `<script>` 标签或 npm 包形式发布，让你的网站最终用户可以用自然语言驱动 UI（“点击登录，填写用户名……“）。

贡献可选技能

要向仓库添加新的可选技能：

在 optional-skills/<category>/<skill-name>/ 下创建目录
添加 SKILL.md，包含标准 frontmatter（名称、描述、版本、作者）
在 references/、templates/ 或 scripts/ 子目录中包含任何支持文件
提交拉取请求——技能将出现在此目录中，并在合并后获得自己的文档页面

好奇心花园🪴

探索

最近的笔记

note-template

getMoon.js

getWeather.js

可选技能目录

可选技能目录

autonomous-ai-agents（自主 AI 代理）

blockchain（区块链）

communication（沟通）

creative（创意）

devops（运维）

dogfood（内部测试）

email（邮件）

finance（金融）

health（健康）

mcp（MCP）

migration（迁移）

mlops（MLOps）

productivity（生产力）

research（研究）

security（安全）

software-development（软件开发）

web-development（Web 开发）

贡献可选技能

关系图谱

目录

反向链接