Блог гайд

Промт для генерации картинки

Промт для картинки — текстовое описание сцены, по которому нейросеть генерирует изображение. В отличие от текстовых промтов, здесь важен визуальный язык: упоминания художников, операторов, фотографических терминов, параметров камеры. Чем точнее визуальный словарь — тем ближе результат к замыслу.

В 2026 году ведущие модели генерации картинок: Midjourney 6.1, DALL-E / GPT Image, Stable Diffusion / Flux, Nano Banana (Google), Шедеврум (Яндекс), Kandinsky 6.0 (Сбер), Recraft, Ideogram, Leonardo AI.

Структура промта для картинки

Универсальная структура подходит для большинства моделей:

[субъект и действие], [окружение и контекст],
[стиль / художник / референс], [освещение],
[композиция и ракурс], [цветовая палитра],
[технические параметры]

Пример: editorial photograph of a young architect standing in front of a glass building at dusk, in the style of magnum photos, soft golden hour light, medium telephoto lens shot from below, muted warm palette of cream and slate blue, shallow depth of field.

Из чего состоит каждый блок

1. Субъект и действие

Кто/что на картинке и что делает. Конкретика > общие слова.

Плохо: «человек в офисе». Хорошо: «молодая женщина в льняной рубашке стоит у окна с ноутбуком в руках, в просторном офисе с деревянными столами».

2. Стиль или художник

Самый сильный рычаг. Один-два референса задают всю эстетику.

  • Фотография: editorial photography, magnum photos, National Geographic, Annie Leibovitz, Henri Cartier-Bresson
  • Иллюстрация: Adrian Tomine, Marcel Dzama, Jean Jullien, New Yorker editorial illustration
  • Живопись: Edward Hopper, Andrew Wyeth, Norman Rockwell, gouache illustration
  • 3D / digital: isometric 3D render, low-poly, Pixar style, Blender render
  • Аниме: Studio Ghibli, Makoto Shinkai

В русскоязычных моделях (Шедеврум, Kandinsky) лучше работают описания стиля русскими словами: «в стиле акварельной иллюстрации», «как фотография 1970-х годов».

3. Освещение

Без указания света нейросеть выдаст плоскую среднюю экспозицию.

  • Soft afternoon light from a window — мягкий боковой свет
  • Golden hour, warm rim light — закатное освещение
  • Studio lighting, three-point setup — студийный свет
  • Moody dim light from a single lamp — драматичный одиночный свет
  • Soft blue dusk — синие сумерки
  • Backlit, silhouette — контровый, силуэт

4. Композиция и ракурс

  • Wide shot, full body — общий план
  • Medium shot, waist up — средний
  • Close-up, face only — крупный
  • Top-down view, flat lay — сверху
  • Shot from below, dramatic angle — снизу
  • Rule of thirds, subject on the left — правило третей
  • Centered, symmetrical composition — симметрия

5. Цветовая палитра

  • Muted warm palette of cream, sage green, natural oak
  • High-contrast palette of black, white and red accent
  • Pastel palette with soft pink, lavender, mint
  • Monochromatic blue palette

6. Технические параметры (Midjourney)

--ar 16:9       # соотношение сторон
--style raw     # без художественной обработки
--v 6.1         # версия модели
--stylize 100   # уровень стилизации (0-1000)
--chaos 10      # вариативность (0-100)

Негативные промты — что НЕ показывать

В Stable Diffusion, Kandinsky и других моделях с поддержкой negative prompt можно явно запретить нежелательное. Стандартный набор:

negative: blurry, low quality, text, watermark, signature,
extra fingers, deformed hands, distorted face,
oversaturated, plastic skin

Midjourney поддерживает аналог через --no: --no text, watermark, blurry hands.

Примеры рабочих промтов

Иллюстрация для статьи

Editorial illustration of a young woman sitting at a wooden desk
in a bright apartment, working on a laptop with focus,
in the style of Adrian Tomine, New Yorker magazine cover,
clean line work with painterly color fills,
soft afternoon light from a window,
single intimate moment,
muted palette of warm cream, sage green and natural oak,
horizontal 16:9 composition, full-bleed
--ar 16:9 --style raw --v 6.1

Фото продукта для интернет-магазина

Editorial product photography of a ceramic coffee mug
on a wooden table, top-down view, flat lay,
soft natural window light from the left,
shallow depth of field,
beside the mug: a few coffee beans, a small spoon,
a folded linen napkin,
muted warm palette of cream and walnut,
clean minimalist composition with negative space on the right
--ar 4:5 --style raw --v 6.1 --no text, logo, watermark

Логотип / иконка

Minimal flat icon of a paper plane,
vector style, single colour deep teal on cream background,
geometric and balanced,
inspired by Dieter Rams design principles,
clean lines, no gradients, no shadows
--ar 1:1 --style raw --v 6.1

Для логотипов отдельно — Recraft (нативная SVG-генерация), Ideogram (точный текст).

Аватар / портрет

Studio portrait of a young woman in her late twenties,
warm friendly smile, looking directly at camera,
soft studio lighting with subtle rim light from the right,
neutral grey background,
in the style of editorial portrait photography,
85mm lens, shallow depth of field,
muted warm palette
--ar 1:1 --style raw --v 6.1

Сценический кадр для видео-сториборда

Wide cinematic shot of a young man walking
across an empty Moscow square at dawn,
soft pink-blue dawn light, long shadows,
single figure small in frame, dramatic perspective,
in the style of Roger Deakins cinematography,
muted cool palette of slate blue and warm cream,
35mm lens, anamorphic aspect ratio
--ar 21:9 --style raw --v 6.1

Особенности разных моделей

Midjourney

  • Лучший общий результат на «художественных» промтах
  • Параметры через --: --ar, --style, --v, --stylize, --chaos, --no
  • Image-to-image через --cref (character reference), --sref (style reference)
  • Подробнее — Midjourney обзор, промты для Midjourney

DALL-E 3 / GPT Image

  • Хорошо понимает длинные описательные промты на естественном языке
  • Слабее в фотореализме, сильнее в иллюстрациях и инфографике
  • Лучше всех генерирует текст на изображении — но в 2026 эту нишу забирает Ideogram и Recraft
  • Подробнее — DALL-E обзор

Stable Diffusion / Flux

  • Open-source, можно запускать локально
  • Полный контроль: negative prompts, ControlNet, LoRA-модели
  • Требует подбора параметров и моделей
  • Подробнее — Stable Diffusion, Flux

Шедеврум (Яндекс)

  • Бесплатно, без VPN, на русском
  • Хорошо понимает русские описания стилей
  • Слабее в фотореализме сложных сцен
  • Подробнее — Шедеврум обзор

Kandinsky (Сбер)

  • Бесплатно, в GigaChat и отдельно
  • Сильная сторона — image-to-image, реставрация фото
  • На русском работает лучше, чем западные модели на en-промтах в обратном переводе
  • Подробнее — Kandinsky обзор

Типичные ошибки промтинга картинок

Слишком много субъектов. «Девушка, кот, собака, ноутбук, кофе, цветы, окно, диван» — модель сделает каши. Лучше 1-2 главных субъекта + лаконичная среда.

Конфликтующие стили. «Anime style + Edward Hopper» — модель выберет один, или сделает плохо оба. Один референс за раз.

Отрицания в позитивном промте. «Без текста, без водяного знака, не размытое» — модель не различает «не». Все запреты — в negative prompt или --no.

Слишком абстрактно. «Красиво, креативно, современно» — модель не знает, что вы имеете в виду. Заменяйте на конкретные референсы.

Игнорирование освещения. Без указания света результат плоский. Освещение — главный визуальный ингредиент.

FAQ

В какой нейросети писать промт на русском? Шедеврум, Kandinsky, Алиса картинки — оптимизированы под русский. В Midjourney/DALL-E/Flux — лучше переводить в английский, качество вырастет в разы.

Длинный или короткий промт? Зависит от модели. Midjourney 6.1 хорошо работает с короткими промтами (10-20 слов + параметры). DALL-E 3 хорошо понимает длинные описательные (50-100 слов). Stable Diffusion — средний.

Почему хорошие промты бесполезны? Часто проблема не в промте, а в модели. Если нужен фотореализм — Midjourney или Flux. Если иллюстрация — DALL-E или Recraft. Если фото с текстом — Ideogram. Промт сильнее на хорошей модели.

Где брать референсы стиля? Гугл-поиск имён: «editorial photography», «New Yorker illustrators», «golden age illustration». Полезный сервис — PromptHero с примерами промтов и стилями.

Можно ли копировать стиль конкретного художника? Технически — да, по имени. Юридически — серая зона. По данным Adobe Firefly документации, коммерчески безопасные модели специально не обучают на работах живых художников. Для коммерческого использования — лучше Firefly или собственный custom model.