Блог обзор

Hermes AI — self-hosted агент

Hermes Agent — open-source AI-агент от Nous Research, который работает локально на вашей машине и подключается к любой LLM через OpenRouter, Anthropic API, OpenAI API или локальным моделям (Ollama, vLLM).

Главное отличие от Claude Codeнезависимость от вендора: модель можно менять одной командой, данные не уходят за пределы вашей инфраструктуры (если используете локальную модель), весь код открыт.

В Wordstat — 1 355 показов/мес по запросу «hermes ai». Это растущий запрос среди разработчиков, которые хотят AI-агента без зависимости от Anthropic / OpenAI.

Главное в 30 секунд

ПараметрHermes Agent
Типself-hosted AI-агент
Моделилюбая через OpenRouter / Anthropic / OpenAI / Ollama
Open source✓ да
ПлатформаmacOS / Linux
Главный конкурентClaude Code
Установкаbash-скрипт + конфиг

Зачем Hermes если есть Claude Code

Claude Code — отличный агент на платформе Anthropic. Hermes решает несколько проблем, которые есть у Claude Code:

1. Vendor lock-in

Claude Code работает только с Claude. Хотите GPT-5 на сложной задаче или дешёвый DeepSeek на рутине — нужно переключаться вручную или использовать другой инструмент. Hermes через OpenRouter даёт 300+ моделей через один интерфейс.

2. Цена

Подписка Claude Pro $20/мес или Max $100-200/мес. Hermes — оплата только по факту использованных токенов через OpenRouter. На маленьком объёме — в 5-10 раз дешевле.

3. Локальные модели

Если данные критично конфиденциальные — Hermes может работать с локальной моделью через Ollama / vLLM. Ничего не уходит наружу.

4. Открытый код

Можно посмотреть как работает каждый компонент, изменить под себя, добавить свои tools. Claude Code — закрытый исходник.

5. Кросс-модельные эксперименты

Тестируйте промт на Claude, GPT-5, Gemini, DeepSeek — без переписывания кода или переключения IDE.

Архитектура Hermes

Hermes Agent (local)

       ├─ Tools: read_file, write_file, run_bash, grep, search, ...

       ├─ Model providers:
       │     ├─ OpenRouter API (любая модель)
       │     ├─ Anthropic API напрямую
       │     ├─ OpenAI API напрямую
       │     └─ Local: Ollama / vLLM

       └─ Memory: local files (как OpenClaw)

Hermes запускается как процесс или CLI-тула, читает ваши промты, делает tool-вызовы, возвращает результат. Ту же роль играет Claude Code, но привязанная к одной модели.

Установка (общий процесс)

Точные шаги — в официальном репозитории Nous Research. Общий процесс:

# Клонируем репозиторий
git clone https://github.com/NousResearch/hermes-agent
cd hermes-agent

# Установка через bash-скрипт
./install.sh

# Конфигурация
export OPENROUTER_API_KEY="sk-or-..."
# или
export ANTHROPIC_API_KEY="sk-ant-..."
# или
export OPENAI_API_KEY="sk-..."

# Запуск
hermes

После установки — hermes доступен как CLI-команда.

Как использовать

Базовый цикл такой же как у Claude Code:

$ hermes
Hermes Agent ready. What should I do?

> Прочитай файл README.md и обновлeни его с актуальной информацией.

[Agent reads file, processes, writes update]

✓ README.md updated. Changes:
  - Added new "Quick Start" section
  - Updated installation instructions
  - Added 3 examples

> Запусти тесты и сообщи если что-то сломалось.

[Agent runs npm test, monitors output]

✓ All 47 tests passing.

> commit изменения с понятным сообщением.

[Agent commits]

✓ Committed: "docs: update README with Quick Start section"

Конфигурация модели

В ~/.hermes/config.json:

{
  "provider": "openrouter",
  "model": "anthropic/claude-opus-4",
  "fallback": [
    "openai/gpt-5",
    "google/gemini-2.5-pro"
  ],
  "max_tokens": 4096,
  "temperature": 0.3
}

Поменять модель — изменить одну строку. Тот же агент с DeepSeek-V3 на рутинных задачах, с Claude Opus на сложных, с локальным Llama на чувствительных данных.

Tools

Hermes предоставляет стандартный набор tools:

  • read_file / write_file / edit_file — работа с файлами
  • run_bash — выполнение shell-команд
  • grep / find — поиск в коде
  • web_search / web_fetch — интернет
  • git operations — git status / diff / commit / push
  • custom tools — добавить через плагины

Можно добавить свои tools на Python — например интеграцию с собственной БД, API, документацией.

Hermes vs Claude Code

ПараметрHermesClaude Code
Моделилюбаятолько Claude
Open source
Ценапо факту токенов$20-200/мес подписка
Локальные модели✓ через Ollama
Установкаbash-скрипт + ключиофициальный установщик
ПоддержкасообществоAnthropic + community
Skillsсвои Python toolsофициальные + custom
Зрелостьрастётproduction-grade
Документацияcommunityofficial + полная

Когда выбрать Hermes:

  • Нужна независимость от Anthropic
  • Хотите оптимизировать стоимость через комбинацию моделей
  • Чувствительные данные (локальные модели)
  • Любите open-source и хотите кастомизировать

Когда выбрать Claude Code:

  • Хотите готовое решение «из коробки»
  • Используете Claude как основную модель
  • Нужна максимальная зрелость и стабильность
  • Платите за подписку — устраивает фикс-цена

Hermes vs другие подходы

vs OpenAI Codex

Codex — закрытый, работает только с OpenAI. Тот же vendor lock-in, что и у Claude Code.

vs AutoGPT / BabyAGI

Эти ранние агенты (2023) были концептами. Hermes — production-готовый, с правильной архитектурой tool-calling, без зацикливания.

vs CrewAI / AutoGen

Эти — фреймворки для команд агентов. Hermes — один агент. Можно совмещать: Hermes на каждом узле команды CrewAI.

vs OpenClaw

OpenClaw — это workspace поверх Claude Code (мой авторский). Hermes — независимый агент. Идейно близки, разные платформы.

Реальные кейсы использования

1. Soло-разработчик с переменной нагрузкой. Использует DeepSeek-V3 ($0.27/1M) для рутины и Claude Opus ($15/1M) для сложных задач. Hermes — оптимизатор стоимости.

2. Корпорация с требованиями к приватности. Запускает Hermes с локальной Llama 4 70B через Ollama. Данные не покидают сеть.

3. Исследователь AI-агентов. Использует Hermes как платформу для экспериментов: тестирует новые промты, новые модели, новые tools.

4. Open-source разработчик. Контрибьютит в Hermes core и пишет свои plugins.

Безопасность и приватность

  • С локальной моделью — данные не покидают вашу машину
  • Через OpenRouter — данные идут через OpenRouter → провайдер. Политика хранения у каждого провайдера разная
  • Через прямой API — данные идут напрямую к провайдеру (Anthropic / OpenAI)
  • Логи — Hermes логирует локально, можно настроить уровень

Для конфиденциальных задач — однозначно локальная модель.

Производительность

  • Через OpenRouter — задержка +100-200ms к прямому API (proxy-эффект)
  • Прямой API — максимальная скорость
  • Локальные модели — зависит от железа. На MacBook Pro M3 Max — Llama 4 70B даёт ~10-15 tokens/sec, не быстро но рабочая скорость

Установка из России

nousresearch.com и GitHub репозиторий доступны из РФ без VPN. Для пополнения OpenRouter — нужна виртуальная карта. Для локальных моделей — никакая оплата не нужна.

С чего начать

  1. Прочитать Claude Code обзор — фундаментальные концепции одинаковые
  2. Зарегистрироваться на OpenRouter — пополнить баланс на $5
  3. Установить Hermes из официального репозитория
  4. Настроить config.json под желаемую модель
  5. Запустить первую задачу на pet-проекте

Через 1-2 недели использования — поймёте, заменяет ли Hermes для вас Claude Code или дополняет его.

FAQ

Где скачать Hermes Agent? Официальный сайт — nousresearch.com. Также в GitHub-репозитории Nous Research.

Hermes бесплатный? Сам агент — да, open-source. Платите только за токены модели (если не используете локальную). На локальной модели Hermes полностью бесплатный (платите только за электричество и железо).

Можно ли использовать Hermes без интернета? Да, с локальной моделью через Ollama / vLLM. Полная автономия.

Hermes лучше Claude Code? Не лучше и не хуже — другой. Hermes — независимость и гибкость. Claude Code — зрелость и интеграция с Anthropic.

Можно ли использовать вместе с OpenClaw? Технически да, но идейно один из них. OpenClaw — поверх Claude Code, Hermes — независимый. Чаще выбирают один.

Какие модели лучше всего работают в Hermes? По общему мнению — Claude Opus 4.7 (через Anthropic API или OpenRouter), GPT-5, локальная Llama 4 70B+. На рутинных задачах — DeepSeek-V3 для экономии.

Поддерживает ли Hermes русский? Зависит от модели. Большинство современных моделей понимают русский — Hermes тут просто оркестратор.

Нужен ли быстрый компьютер? Для облачных моделей — нет, любой компьютер с интернетом. Для локальных — да: минимум 32 GB RAM, лучше 64 GB + GPU.