Hermes AI — self-hosted агент
Hermes Agent — open-source AI-агент от Nous Research, который работает локально на вашей машине и подключается к любой LLM через OpenRouter, Anthropic API, OpenAI API или локальным моделям (Ollama, vLLM).
Главное отличие от Claude Code — независимость от вендора: модель можно менять одной командой, данные не уходят за пределы вашей инфраструктуры (если используете локальную модель), весь код открыт.
В Wordstat — 1 355 показов/мес по запросу «hermes ai». Это растущий запрос среди разработчиков, которые хотят AI-агента без зависимости от Anthropic / OpenAI.
Главное в 30 секунд
| Параметр | Hermes Agent |
|---|---|
| Тип | self-hosted AI-агент |
| Модели | любая через OpenRouter / Anthropic / OpenAI / Ollama |
| Open source | ✓ да |
| Платформа | macOS / Linux |
| Главный конкурент | Claude Code |
| Установка | bash-скрипт + конфиг |
Зачем Hermes если есть Claude Code
Claude Code — отличный агент на платформе Anthropic. Hermes решает несколько проблем, которые есть у Claude Code:
1. Vendor lock-in
Claude Code работает только с Claude. Хотите GPT-5 на сложной задаче или дешёвый DeepSeek на рутине — нужно переключаться вручную или использовать другой инструмент. Hermes через OpenRouter даёт 300+ моделей через один интерфейс.
2. Цена
Подписка Claude Pro $20/мес или Max $100-200/мес. Hermes — оплата только по факту использованных токенов через OpenRouter. На маленьком объёме — в 5-10 раз дешевле.
3. Локальные модели
Если данные критично конфиденциальные — Hermes может работать с локальной моделью через Ollama / vLLM. Ничего не уходит наружу.
4. Открытый код
Можно посмотреть как работает каждый компонент, изменить под себя, добавить свои tools. Claude Code — закрытый исходник.
5. Кросс-модельные эксперименты
Тестируйте промт на Claude, GPT-5, Gemini, DeepSeek — без переписывания кода или переключения IDE.
Архитектура Hermes
Hermes Agent (local)
│
├─ Tools: read_file, write_file, run_bash, grep, search, ...
│
├─ Model providers:
│ ├─ OpenRouter API (любая модель)
│ ├─ Anthropic API напрямую
│ ├─ OpenAI API напрямую
│ └─ Local: Ollama / vLLM
│
└─ Memory: local files (как OpenClaw)
Hermes запускается как процесс или CLI-тула, читает ваши промты, делает tool-вызовы, возвращает результат. Ту же роль играет Claude Code, но привязанная к одной модели.
Установка (общий процесс)
Точные шаги — в официальном репозитории Nous Research. Общий процесс:
# Клонируем репозиторий
git clone https://github.com/NousResearch/hermes-agent
cd hermes-agent
# Установка через bash-скрипт
./install.sh
# Конфигурация
export OPENROUTER_API_KEY="sk-or-..."
# или
export ANTHROPIC_API_KEY="sk-ant-..."
# или
export OPENAI_API_KEY="sk-..."
# Запуск
hermes
После установки — hermes доступен как CLI-команда.
Как использовать
Базовый цикл такой же как у Claude Code:
$ hermes
Hermes Agent ready. What should I do?
> Прочитай файл README.md и обновлeни его с актуальной информацией.
[Agent reads file, processes, writes update]
✓ README.md updated. Changes:
- Added new "Quick Start" section
- Updated installation instructions
- Added 3 examples
> Запусти тесты и сообщи если что-то сломалось.
[Agent runs npm test, monitors output]
✓ All 47 tests passing.
> commit изменения с понятным сообщением.
[Agent commits]
✓ Committed: "docs: update README with Quick Start section"
Конфигурация модели
В ~/.hermes/config.json:
{
"provider": "openrouter",
"model": "anthropic/claude-opus-4",
"fallback": [
"openai/gpt-5",
"google/gemini-2.5-pro"
],
"max_tokens": 4096,
"temperature": 0.3
}
Поменять модель — изменить одну строку. Тот же агент с DeepSeek-V3 на рутинных задачах, с Claude Opus на сложных, с локальным Llama на чувствительных данных.
Tools
Hermes предоставляет стандартный набор tools:
- read_file / write_file / edit_file — работа с файлами
- run_bash — выполнение shell-команд
- grep / find — поиск в коде
- web_search / web_fetch — интернет
- git operations — git status / diff / commit / push
- custom tools — добавить через плагины
Можно добавить свои tools на Python — например интеграцию с собственной БД, API, документацией.
Hermes vs Claude Code
| Параметр | Hermes | Claude Code |
|---|---|---|
| Модели | любая | только Claude |
| Open source | ✓ | ✗ |
| Цена | по факту токенов | $20-200/мес подписка |
| Локальные модели | ✓ через Ollama | ✗ |
| Установка | bash-скрипт + ключи | официальный установщик |
| Поддержка | сообщество | Anthropic + community |
| Skills | свои Python tools | официальные + custom |
| Зрелость | растёт | production-grade |
| Документация | community | official + полная |
Когда выбрать Hermes:
- Нужна независимость от Anthropic
- Хотите оптимизировать стоимость через комбинацию моделей
- Чувствительные данные (локальные модели)
- Любите open-source и хотите кастомизировать
Когда выбрать Claude Code:
- Хотите готовое решение «из коробки»
- Используете Claude как основную модель
- Нужна максимальная зрелость и стабильность
- Платите за подписку — устраивает фикс-цена
Hermes vs другие подходы
vs OpenAI Codex
Codex — закрытый, работает только с OpenAI. Тот же vendor lock-in, что и у Claude Code.
vs AutoGPT / BabyAGI
Эти ранние агенты (2023) были концептами. Hermes — production-готовый, с правильной архитектурой tool-calling, без зацикливания.
vs CrewAI / AutoGen
Эти — фреймворки для команд агентов. Hermes — один агент. Можно совмещать: Hermes на каждом узле команды CrewAI.
vs OpenClaw
OpenClaw — это workspace поверх Claude Code (мой авторский). Hermes — независимый агент. Идейно близки, разные платформы.
Реальные кейсы использования
1. Soло-разработчик с переменной нагрузкой. Использует DeepSeek-V3 ($0.27/1M) для рутины и Claude Opus ($15/1M) для сложных задач. Hermes — оптимизатор стоимости.
2. Корпорация с требованиями к приватности. Запускает Hermes с локальной Llama 4 70B через Ollama. Данные не покидают сеть.
3. Исследователь AI-агентов. Использует Hermes как платформу для экспериментов: тестирует новые промты, новые модели, новые tools.
4. Open-source разработчик. Контрибьютит в Hermes core и пишет свои plugins.
Безопасность и приватность
- С локальной моделью — данные не покидают вашу машину
- Через OpenRouter — данные идут через OpenRouter → провайдер. Политика хранения у каждого провайдера разная
- Через прямой API — данные идут напрямую к провайдеру (Anthropic / OpenAI)
- Логи — Hermes логирует локально, можно настроить уровень
Для конфиденциальных задач — однозначно локальная модель.
Производительность
- Через OpenRouter — задержка +100-200ms к прямому API (proxy-эффект)
- Прямой API — максимальная скорость
- Локальные модели — зависит от железа. На MacBook Pro M3 Max — Llama 4 70B даёт ~10-15 tokens/sec, не быстро но рабочая скорость
Установка из России
nousresearch.com и GitHub репозиторий доступны из РФ без VPN. Для пополнения OpenRouter — нужна виртуальная карта. Для локальных моделей — никакая оплата не нужна.
С чего начать
- Прочитать Claude Code обзор — фундаментальные концепции одинаковые
- Зарегистрироваться на OpenRouter — пополнить баланс на $5
- Установить Hermes из официального репозитория
- Настроить config.json под желаемую модель
- Запустить первую задачу на pet-проекте
Через 1-2 недели использования — поймёте, заменяет ли Hermes для вас Claude Code или дополняет его.
FAQ
Где скачать Hermes Agent? Официальный сайт — nousresearch.com. Также в GitHub-репозитории Nous Research.
Hermes бесплатный? Сам агент — да, open-source. Платите только за токены модели (если не используете локальную). На локальной модели Hermes полностью бесплатный (платите только за электричество и железо).
Можно ли использовать Hermes без интернета? Да, с локальной моделью через Ollama / vLLM. Полная автономия.
Hermes лучше Claude Code? Не лучше и не хуже — другой. Hermes — независимость и гибкость. Claude Code — зрелость и интеграция с Anthropic.
Можно ли использовать вместе с OpenClaw? Технически да, но идейно один из них. OpenClaw — поверх Claude Code, Hermes — независимый. Чаще выбирают один.
Какие модели лучше всего работают в Hermes? По общему мнению — Claude Opus 4.7 (через Anthropic API или OpenRouter), GPT-5, локальная Llama 4 70B+. На рутинных задачах — DeepSeek-V3 для экономии.
Поддерживает ли Hermes русский? Зависит от модели. Большинство современных моделей понимают русский — Hermes тут просто оркестратор.
Нужен ли быстрый компьютер? Для облачных моделей — нет, любой компьютер с интернетом. Для локальных — да: минимум 32 GB RAM, лучше 64 GB + GPU.
Связанные статьи
- Пол Миллерд: $250K увольнение и $125K с самиздата — $15K/мес
- Neuro: $100M на жвачке с ноотропиками — кейс Райана Чена — $10M/мес
- Ideogram — нейросеть для текста на изображениях, обзор 2026
- YandexGPT и Алиса AI — нейросеть Яндекса, обзор и тарифы 2026
- Claude — тарифы и подписка 2026, Pro / Max / Team / API