5 мая 2026 г.

Hermes AI — открытое семейство LLM и ИИ-агент от Nous Research

Hermes — открытое семейство языковых моделей и одноимённый ИИ-агент от Nous Research, независимой исследовательской лаборатории из Сан-Франциско. Под одним брендом сосуществуют две сущности: Hermes LLM — линейка fine-tune-моделей на базе Llama, Mistral и Qwen (Hermes 4 в размерах 14B / 70B / 405B, DeepHermes-3 8B, Hermes 3 в трёх размерах, Hermes-Pro и Hermes-Mistral), и Hermes Agent — self-hosted ИИ-агент на Python, который умеет работать с любой LLM. Лицензия моделей — Llama Community License + Apache 2.0 для агента, веса и код полностью открыты.

Главное практическое отличие Hermes от базовых Llama / Mistral — тщательный пост-тренинг на следование инструкциям, function calling и structured outputs. Hermes 4 в размерах 14B, 70B и 405B обучен на расширенном корпусе ~60 млрд токенов с акцентом на reasoning, поддерживает гибридный режим <think>-трасс и контекст 131K токенов. На MATH-500 версия 405B показывает 96% в reasoning-режиме (источник: Hermes 4 405B Benchmarks, OpenRouter).

Hermes Agent — отдельный продукт того же бренда: open-source агент, живёт на вашей машине, помнит контекст между сессиями, подключается к любой LLM через OpenRouter, Nous Portal, Anthropic, OpenAI или локальной модели (Ollama, vLLM). Релиз — февраль 2026, лицензия MIT, 184k звёзд на GitHub. Главное отличие от Claude Code — vendor-independence, persistent memory, self-improving skills. В Wordstat — 1 355 показов/мес по запросу «hermes ai».

Главное в 30 секунд

Параметр	Hermes LLM	Hermes Agent
Тип	семейство fine-tune LLM	self-hosted ИИ-агент с памятью
Базовая модель	Llama 3.1 / Llama 3.3 / Mistral / Qwen / ByteDance Seed	модель-агностик, использует любую LLM
Размеры	8B, 14B, 70B, 405B (плюс DeepHermes-3 8B)	runtime, требует 1 vCPU и 1 GB RAM
Контекст	до 131K (Hermes 4), до 512K (Hermes 4.3)	зависит от подключённой модели
Лицензия	Llama Community + Apache 2.0	MIT
Доступ	Hugging Face, OpenRouter, Together.AI, Replicate, self-host	`curl install.sh` / PowerShell / Hermes Desktop
Цена через OpenRouter	от $1 / $3 за 1M токенов (Hermes 4 405B)	бесплатный сам по себе
Платформы	любой Linux/macOS/Windows с CUDA или CPU	macOS, Linux, WSL2, Windows native, Termux
Особенности	hybrid reasoning (`<think>`), function calling, ChatML	persistent memory, MCP, 20+ каналов, 60+ skills
Главный конкурент	Llama 4, DeepSeek-V3, Qwen 3, Mistral Large	Claude Code

Кто такие Nous Research

Nous Research — независимая лаборатория из Сан-Франциско, основана в 2023 году. Три направления: распределённое pre-training (DisTrO), RL-фреймворк Atropos, открытые fine-tune Hermes на базе Llama / Mistral / Qwen. Hermes-модели регулярно входят в топ Hugging Face среди community fine-tunes.

Философия Nous — минимальный alignment, максимальная управляемость. Модели обучают на «нейтральном, направляемом пользователем» поведении: меньше отказов, меньше нравоучений, больше точного следования системному промту. Это делает их популярными у разработчиков агентов, ролевых приложений и кастомных пайплайнов, где базовая Llama Instruct «спорит с инструкцией».

Семейство Hermes LLM — что есть в 2026

Hermes — это не одна модель, а несколько поколений и форматов. На 2026 актуальны четыре линейки.

Hermes 4 (август 2025)

Flagship Nous Research. Три размера: 14B, 70B, 405B на базе Meta-Llama-3.1-405B (для старшей). Ключевое:

Hybrid reasoning — переключаемый режим <think>-трасс, один чекпойнт работает и как instruct, и как reasoning. Режим включается системным промтом.
Контекст 131K токенов.
Расширенный post-training — корпус увеличен с 1M / 1.2B токенов (Hermes 3) до ~5M примеров / ~60B токенов с акцентом на reasoning по математике, коду и STEM (источник: Grokipedia, Hermes 4 405B).
SFT для контроля длины reasoning — модель учат завершать <think> на 30 000 токенов, что срезает overlong-ответы до 79.8% с минимальной потерей точности.
Function calling и JSON mode через ChatML + XML-теги <tool_call>, framework-agnostic.

Бенчмарки Hermes 4 405B (Nous custom harness на NVIDIA B200 + SGLang, zero-shot, pass@1):

Бенчмарк	Reasoning ON	Direct
MATH-500	96%	93.1%
AIME 2024	81.9%	—

Источник: model card и независимое ревью (Medium, Hermes 4 review).

DeepHermes-3 (февраль 2025)

Reasoning 8B-чекпойнт на Llama-3.1-8B. Первая модель Nous, где reasoning и обычный режим объединены и переключаются системным промтом. Chain-of-thought до 13 000 токенов, MATH 67% на 8B (источник: Fast.io, Hermes LLM overview), дистилляция из DeepSeek R1 + 150 000 CoT-примеров, 28 GGUF-квантов на Hugging Face. Baseline для self-host: Q4_K_M требует ~6-8 GB VRAM и даёт 40-60 токенов/сек на RTX 4060.

Hermes 3 (август 2024)

Предыдущее поколение. Три размера на Llama 3.1: 8B / 70B / 405B. Корпус — преимущественно синтетические ответы, обучение на следование системному промту, function calling, ролевые задачи. Hermes-3-Llama-3.1-405B остаётся недорогой альтернативой Hermes 4 405B через DeepInfra, OpenRouter, Together.AI.

Hermes-Pro, Hermes-Mistral, Hermes 4.3

Hermes 2 Pro в своё время показала 90% на function-calling и 84% на structured JSON output — зафиксировала стандарт ChatML + XML-tool-calls. Hermes-Mistral — fine-tune Mistral-7B и Mixtral-8x7B, актуальна для Mistral-стека. Hermes 4.3 — экспериментальная сборка на ByteDance Seed 36B с контекстом 512K, первый non-Llama base.

Чем Hermes отличается от base Llama

Базовая Llama 3.1 Instruct — это generalist, обученный широкому спектру задач без особенного фокуса на тулинг и системные промты. Hermes берёт ту же базу и доучивает её на трёх вещах:

Точное следование инструкциям. Hermes реже игнорирует системный промт, не уводит ответ в «безопасную» сторону без необходимости, держит формат.
Function calling из коробки. Стандартный ChatML + XML-теги <tool_call>{...}</tool_call> парсятся любой системой, поддерживающей XML и JSON. Базовая Llama требует промт-инжиниринга или дополнительной обвязки.
Reasoning-режим (Hermes 4, DeepHermes-3). Переключаемые <think>-трассы, обученные на CoT-данных и дистилляции из DeepSeek R1.

Простой ответ на вопрос «зачем брать Hermes, если есть Llama?»: если задача — построить агента, который надёжно вызывает тулы и подчиняется системному промту, Hermes даёт это «из коробки», без подгонки промтов под базовую Llama.

Доступ к Hermes — четыре способа

1. OpenRouter — самый простой и без VPN

OpenRouter — основная точка входа для пользователей из России. Hermes-модели доступны под одним ключом, оплата с любой карты (включая виртуальные карты для зарубежных сервисов).

Актуальные цены на момент материала (источник: OpenRouter Hermes 4 405B):

Модель	Input	Output	Контекст
Hermes 4 405B	$1 / 1M	$3 / 1M	131K
Hermes 4 70B	дешевле 405B	дешевле 405B	131K
Hermes 3 405B	публично указано на OpenRouter	публично указано на OpenRouter	до 131K
DeepHermes-3 8B	бесплатные и платные провайдеры	бесплатные и платные провайдеры	128K

OpenRouter автоматически роутит запрос к лучшему провайдеру с fallback на запасных. Конкретные цены младших моделей и провайдеров смотрите на странице каждой модели на OpenRouter — они меняются.

2. Hugging Face — официальные веса

Все Hermes-модели опубликованы Nous Research на huggingface.co/NousResearch. Здесь же — FP8-кванты, GGUF, оригинальные BF16-веса. Hugging Face из России требует VPN для скачивания крупных весов; альтернатива — зеркала и сервисы вроде Together.AI, которые сами хостят модели.

3. Together.AI и Replicate

Платные облачные провайдеры, держат Hermes 3 / 4 как managed endpoints. Удобно, если нужен SLA и не хочется возиться с self-host. Оплата в долларах, карты РФ не принимают — нужна виртуальная карта.

4. Self-host — Ollama, vLLM, SGLang

Полный контроль и оффлайн. Варианты по железу:

Модель	Минимум для inference	Комфортно
DeepHermes-3 8B (Q4)	6-8 GB VRAM (RTX 4060 / 3060)	16 GB VRAM
Hermes 4 14B (Q4-Q5)	12 GB VRAM	24 GB VRAM (RTX 4090)
Hermes 4 70B (Q4)	48 GB VRAM (2× RTX 4090 / A6000)	4× A100 80GB
Hermes 4 405B (FP8)	8× H100 80GB	DGX-кластер

Самый простой способ self-host для разработчика — Ollama: ollama pull nous-hermes2 или GGUF-сборка через ollama create. Для продакшна — vLLM или SGLang с FP8-квантами.

Hermes LLM vs Llama 4, DeepSeek, Mistral, Qwen

Параметр	Hermes 4	Llama 4	DeepSeek-V3	Mistral Large	Qwen 3
Происхождение	Nous, fine-tune Llama	Meta, base + instruct	DeepSeek (CN), своя архитектура	Mistral AI (FR)	Alibaba (CN)
Размеры	14B / 70B / 405B	8B / 70B / 405B / MoE	671B MoE	123B	0.6B–235B MoE
Reasoning toggle	да, `<think>`	нет	DeepSeek-R1 отдельно	нет	да, Qwen3-Thinking
Function calling	ChatML + XML	штатно, но базово	штатно	штатно	штатно
Цензура / refusal	минимальная	средняя	минимальная по EN, цензура по CN-темам	средняя	цензура по CN-темам
Контекст	131K (4), 512K (4.3)	1M	128K	128K	256K
Цена через OpenRouter	от $1 / $3	от $0.4 / $1.6	от $0.27 / $1.1	от $2 / $6	от $0.4 / $1.4
Лицензия	Llama Community	Llama Community	MIT-like	Mistral Research / Commercial	Tongyi Qianwen

Короткий вывод. Hermes — если важна минимальная цензура и стабильное следование инструкциям в агентских задачах. Llama 4 — если нужен максимальный контекст 1M. DeepSeek-V3 — самый дешёвый MoE в производительности на доллар. Mistral Large — европейская альтернатива с акцентом на enterprise. Qwen 3 — лучшая поддержка китайского и Asia-стека.

Use-cases Hermes LLM

Личный ассистент-агент. Hermes 4 70B локально + Hermes Agent сверху = автономный помощник без облака. Подходит для чувствительных данных.
Ролевые приложения. Минимальный refusal-rate делает Hermes стандартом для interactive fiction, RPG-NPC, character-чатов.
Function calling в продакшне. ChatML + XML-tool-calls парсятся надёжно, не требуют сложной обвязки. Подходит для production-агентов.
Кастомные fine-tune. Hermes — удобная стартовая точка для дальнейшего дообучения под доменную задачу. Открытые веса + Apache-совместимая лицензия + готовый pipeline на Atropos.
Reasoning-задачи без облака. DeepHermes-3 8B в Q4 крутится на ноутбучном GPU и даёт chain-of-thought качества, сопоставимого с дорогими облачными reasoning-моделями на конкретных бенчмарках.
Reranker / классификатор. 8B-версии достаточно для тегирования, классификации намерений, переранжирования поисковой выдачи в RAG-пайплайне.

Где Hermes сильнее

Следование системному промту. Главная причина выбрать Hermes — поведение под инструкцией предсказуемее, чем у base Llama Instruct.
Открытость и кастомизация. Веса, формат данных, training-pipeline — всё публично. Можно дообучать под закрытый домен.
Минимальная цензура. Подход «нейтральное, направляемое пользователем поведение» — Hermes реже уходит в отказ на пограничных, но легитимных запросах.
Function calling из коробки. Не нужно изобретать формат вызова тулов — Nous уже зафиксировал ChatML + XML и обучил модель на нём.
Reasoning без отдельной модели. Один чекпойнт работает и как instruct, и как reasoning через системный промт.

Где Hermes слабее

Нет официального chat-UI. Hermes-LLM — только веса. Если нужен chat вроде ChatGPT — собирайте свой через OpenWebUI / LibreChat либо берите Hermes Agent.
Нет голосового режима. Голос — это TTS/STT поверх (Whisper + любая TTS), не сама модель.
Экосистема меньше, чем у OpenAI / Anthropic. Нет официальных плагинов, marketplace-агентов, mobile-приложения «Hermes».
Документация местами лаборатoрная. Это не enterprise-продукт — README на Hugging Face иногда обновляется с задержкой к релизу.
Multimodal — отдельная история. На 2026 основное семейство Hermes — текстовое; vision-варианты есть, но идут отдельными чекпойнтами с другим качеством.

152-ФЗ и персональные данные

Для российских компаний, работающих с ПДн, действует правило: ПДн граждан РФ должны храниться и первично обрабатываться на территории РФ (152-ФЗ, ст. 18, ч. 5). Self-host на российском VPS (Timeweb Cloud, Selectel, Yandex Cloud, VK Cloud) или собственном сервере — данные не покидают периметр. OpenRouter и Together.AI — США/ЕС, для ПДн напрямую не подходят без отдельного юридического анализа. Рабочий шаблон: Hermes 4 70B на GPU-сервере в РФ + Hermes Agent сверху + локальный векторный store = полный air-gap.

Hermes Agent — self-improving агент

Hermes Agent — отдельный продукт Nous Research, не путать с моделями Hermes LLM. Это полный стек локального ИИ-ассистента поверх любой LLM, без привязки к вендору.

Архитектура: Python (~84%), TypeScript (~12%). Релиз — февраль 2026, 184k звёзд на GitHub. Не IDE-bound — терминал и шлюз в любом мессенджере.

Ключевая идея — закрытый цикл обучения: агент решает задачу → автоматически пишет skill-документ по стандарту agentskills.io → находит свой skill при похожей задаче через FTS5-поиск по истории сессий → periodic nudges напоминают фиксировать знания → /insights показывает накопленную модель пользователя (проекты, стек, предпочтения).

Это отличает Hermes от Claude Code и Cursor, которые сессионные — каждый чат стартует с нуля. Hermes стартует с уже накопленным контекстом. Чем дольше работает — тем точнее подстраивается.

Главные функции Hermes Agent

CLI и REPL. hermes — одна команда для старта. Внутри терминала — REPL с slash-командами: /new, /reset, /compress, /model anthropic:claude-opus-4-7, /personality, /skills, /usage, /insights --days 30. Настройка — hermes setup или hermes setup --portal для OAuth через Nous Portal.

Подключение моделей. Два унифицированных шлюза и прямые API: OpenRouter (200+ моделей), Nous Portal (300+ через OAuth), Anthropic, OpenAI, NovitaAI, NVIDIA NIM, MiMo, z.ai, Kimi, MiniMax, Hugging Face, локальные Ollama / vLLM. Смена модели — одной строкой в ~/.hermes/config.json или /model в REPL. Поддерживается fallback chain: рутину в DeepSeek, сложное в Claude Opus, чувствительное — в локальную Llama.

Skills и MCP. 60+ встроенных skills (файлы, shell с 6 sandbox-backend, web search, vision, git, GitHub API, MLOps). Поддержка MCP — стандарта Anthropic для подключения внешних серверов. Кастомные skills — markdown по стандарту agentskills.io, агент автоматически находит подходящий и применяет.

Persistent memory и learning loop. Главная инновация — память переживает рестарт. FTS5 full-text search по прошлым разговорам, автоматическая генерация skill-документов после успешных задач, periodic nudges, Honcho dialectic user modeling. Через месяц /insights показывает накопленную модель пользователя.

Sub-agents, cron, gateway. Параллельные изолированные сессии, встроенный cron с natural-language расписаниями («каждое утро в 9:00 сводка GitHub issues»), gateway в 20+ каналов (Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Email, Teams, Home Assistant). Один разговор может начаться в Telegram и закончиться в Slack — контекст сохраняется.

Установка Hermes Agent

Поддерживаются Linux (x86_64 / ARM), macOS, WSL2, Windows native, Termux. Installer сам ставит uv, Python 3.11, Node.js, ripgrep, ffmpeg.

# Linux / macOS / WSL2 / Termux
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)

Для Windows и macOS есть альтернатива — Hermes Desktop installer. После установки — hermes setup --portal для OAuth-варианта или hermes setup для ручной настройки. Конфиг в ~/.hermes/config.json. Миграция из OpenClaw — hermes claw migrate.

Локальные модели vs облачные

Hermes одинаково работает с обоими сценариями. Облачные модели через OpenRouter / Nous Portal — топовое качество и любой ноутбук. Локальные через Ollama / vLLM — приватность и оффлайн, но нужно железо (от 32 GB RAM для 30B, 64 GB + GPU для 70B+). Fallback chain в одном конфиге: рутинные запросы в DeepSeek, сложные в Claude Opus, чувствительные в локальную Llama.

Hermes vs Claude Code vs Cursor vs Aider

Параметр	Hermes	Claude Code	Cursor	Aider
Модели	200+ через OpenRouter, 300+ через Portal	только Claude	Claude / GPT / Gemini	любая
Open source / Self-hosted	да (MIT)	нет	нет	да
Persistent memory	FTS5 + skills + Honcho	базовая (CLAUDE.md)	проектная	нет
Skills	agentskills.io	свой формат	нет	нет
MCP / Sub-agents / Cron	да / да / да	да / да / нет	частично / нет / нет	нет
Каналы	20+ (Telegram, Slack,…)	CLI / VS Code	IDE	CLI
Локальные модели	Ollama, vLLM	нет	нет	через Ollama
Цена	по факту токенов	$20–200/мес	$20/мес	по факту токенов

Когда выбрать Hermes: нужна независимость от Anthropic / OpenAI; хочется комбинировать модели; чувствительные данные → локальные модели; нужен агент в Telegram / Slack без кодинга бота; интересен self-improving подход.

Когда Claude Code: готовое решение, Claude как основная модель, максимальная зрелость в кодинге, устраивает фикс-цена подписки.

Когда Cursor: основной инструмент — IDE, нужен tab-autocomplete и inline-чат.

Когда Aider: нужен только git-aware code-editor без skills, memory, gateway.

Use cases Hermes Agent

Persistent personal-ассистент. Главное применение. Через неделю агент знает проекты, стек, повторяющиеся задачи.
Приватность и compliance. Hermes Agent + локальная Hermes 4 70B = air-gap. Медицина, банки, код под NDA.
DevOps-агент в Telegram. Через gateway — бот на VPS: «глянь логи nginx», «сделай бэкап postgres», cron на естественном языке.
Кросс-модельные эксперименты. Один промт на Claude → GPT-5 → Gemini → DeepSeek; трассы экспортируются в ShareGPT для fine-tune через Atropos.
Командный ИИ-ассистент. Шлюз в Slack / Teams; sub-agents изолируют контексты, command approval modes защищают от случайного деплоя.

Доступ из России

Сайт hermes-agent.nousresearch.com, GitHub-репозиторий и OpenRouter доступны из РФ без VPN. Для пополнения OpenRouter нужна виртуальная карта. Для локальных моделей через Ollama / vLLM оплата не нужна. Hugging Face для скачивания крупных весов часто требует VPN — либо берите модели через Together.AI / Replicate / OpenRouter.

FAQ

Что такое Hermes AI? Hermes — открытое семейство языковых моделей и одноимённый self-hosted ИИ-агент от лаборатории Nous Research. Под брендом существуют две вещи: Hermes LLM (модели Hermes 4, DeepHermes-3, Hermes 3, Hermes-Pro) и Hermes Agent (продукт-обёртка). Бренд один, продукты разные.

Кто такие Nous Research? Независимая ИИ-лаборатория из Сан-Франциско, основана в 2023 году. Занимается распределённым обучением (DisTrO), RL-фреймворком Atropos и открытыми fine-tune-моделями Hermes на базе Llama / Mistral / Qwen.

Чем Hermes отличается от обычной Llama? Hermes — это Llama, дополнительно дообученная на следование инструкциям, function calling, structured outputs и (в Hermes 4 / DeepHermes-3) reasoning-режим. Базовая Llama Instruct — generalist; Hermes более предсказуема под системным промтом и реже отказывает.

Какие сейчас актуальные модели Hermes? Hermes 4 (14B, 70B, 405B) — flagship 2025-2026 с гибридным reasoning и контекстом 131K. DeepHermes-3 8B — reasoning-модель на Llama-3.1-8B. Hermes 3 (8B, 70B, 405B) — предыдущее поколение, всё ещё активно используется. Hermes-Pro и Hermes-Mistral — старшая линейка под Mistral-стек. Hermes 4.3 — экспериментальная сборка на ByteDance Seed 36B с контекстом 512K.

Где скачать Hermes Agent? Официальный сайт — hermes-agent.nousresearch.com. Репозиторий — github.com/nousresearch/hermes-agent.

Где скачать модели Hermes LLM? Все веса опубликованы Nous Research на huggingface.co/NousResearch. Для крупных моделей удобнее брать FP8-кванты или GGUF; есть зеркала через Together.AI и Replicate.

Hermes бесплатный? Сам агент — да, MIT-лицензия. Модели — открытые веса под Llama Community License (allows commercial use до 700M MAU). Оплачиваете только токены модели через OpenRouter или электричество для self-host. На локальной модели через Ollama всё полностью бесплатно после установки.

Сколько стоит Hermes 4 через OpenRouter? Hermes 4 405B — $1 за миллион входных токенов и $3 за миллион выходных. Младшие размеры дешевле, точные цифры — на странице каждой модели на OpenRouter. Карты РФ не принимаются напрямую, нужна виртуальная карта.

Нужен ли VPN для Hermes? Зависит от способа. OpenRouter — без VPN, российские IP работают. Hugging Face для скачивания моделей — обычно требует VPN. Self-host через Ollama после первой установки — без VPN и без интернета вообще.

Можно ли использовать Hermes без интернета? Да, с локальной моделью через Ollama или vLLM. Полная автономия. DeepHermes-3 8B запускается на ноутбучном GPU с 8 GB VRAM, Hermes 4 70B требует уже серверного GPU (4× A100 для комфорта).

Hermes Agent лучше Claude Code? Не лучше — другой. Hermes — vendor-independence, persistent memory, 20+ каналов. Claude Code — зрелость и работа с большими codebases. Hermes выигрывает в памяти между сессиями.

Чем Hermes Agent отличается от Cursor? Cursor — IDE с ИИ внутри. Hermes Agent — CLI без привязки к редактору. Cursor — для IDE, Hermes — для терминала, Telegram, Slack.

Какие модели лучше всего работают в Hermes Agent? Для общей разработки — Claude Opus 4.7, GPT-5, Gemini 2.5 Pro. Локально — Hermes 4 70B, Llama 4, Qwen 3 72B. На рутине — DeepSeek-V3 для экономии.

Что такое Nous Portal? OAuth-шлюз Nous Research с 300+ моделями под единой авторизацией. hermes setup --portal — быстрый старт без ручной возни с ключами.

Где хранится память Hermes Agent? ~/.hermes/ (Unix) или %LOCALAPPDATA%\hermes (Windows). Внутри: sessions/ с FTS5-индексом, skills/, config.json. Бэкап — обычный архив папки.

Hermes лучше DeepSeek-V3 или Llama 4? Зависит от задачи. DeepSeek-V3 дешевле по цене за токен и хорош в коде и математике. Llama 4 — больший контекст (до 1M). Hermes 4 выигрывает у обоих по предсказуемости поведения под системным промтом и меньшему refusal-rate. Для production-агентов чаще берут Hermes, для bulk-генерации — DeepSeek или Llama. См. сравнения DeepSeek, Llama, Mistral, Qwen.

Что такое reasoning-режим в Hermes 4? Гибрид: один и тот же чекпойнт работает либо как обычная instruct-модель, либо как reasoning-модель с явными <think>-трассами. Переключение — системным промтом. В reasoning-режиме Hermes 4 405B показывает 96% на MATH-500 против 93.1% в direct.

Какая лицензия у Hermes? Модели Hermes на базе Llama — Llama Community License (свободно для коммерции до 700M MAU). Hermes-Mistral — Apache 2.0. Hermes Agent — MIT. Все веса можно дообучать и распространять fine-tune.

Подходит ли Hermes для работы с персональными данными граждан РФ? Для соответствия 152-ФЗ нужно self-host на территории РФ (российский VPS / собственный сервер). OpenRouter, Together.AI и другие зарубежные провайдеры для ПДн напрямую не подходят без отдельного юридического анализа. Self-host Hermes 4 70B + Hermes Agent + локальный векторный store даёт полный air-gap.

Можно ли дообучить Hermes под свою задачу? Да: веса открытые, формат данных публичный, обучающий pipeline на Atropos RL. Удобная стартовая точка для domain-specific fine-tune (медицина, юр, корпоративный код).

Дальше

Claude Code обзор — ближайший аналог Hermes Agent, фундаментальные концепции совпадают
Cursor — если работаете в IDE, а не в терминале
OpenRouter — основной провайдер моделей Hermes без VPN
Ollama — локальные модели для self-hosted сценариев
Llama — базовая архитектура, на которой построено большинство Hermes
DeepSeek — открытая альтернатива по цене за токен и reasoning
Mistral — европейский конкурент, основа Hermes-Mistral
Qwen — китайская альтернатива с reasoning-режимом
ИИ-агенты обзор — общий ландшафт автономных агентов 2026