База идей

Synthesia: $8.33M в месяц на ИИ-видео с цифровыми аватарами — кейс Виктора Рипарбелли

Synthesia — платформа ИИ-генерации видео. Вводишь текст, выбираешь цифрового аватара, нажимаешь рендер — получаешь готовое видео. $8.33M выручки в месяц ($100M ARR), 55 000 клиентов, прибыльно, запущено в 2017 году. Поднято $250M+ инвестиций, оценка единорога.

Главное в кейсе — Виктор Рипарбелли построил продукт до того, как мир был готов: в 2016 году нейросетевая генерация видео казалась фантастикой. Семь лет итераций — и категория «text-to-video» теперь принадлежит Synthesia.

Кто такой Виктор Рипарбелли

Датчанин с бэкграундом в технологиях и ИИ. В 2016 переехал в Лондон специально, чтобы заниматься генеративным ИИ — тогда это была экзотика. Прочитал научный paper о генерации реалистичных кадров через нейросети — и понял, что видео можно собирать как текстовый документ.

Какую проблему решает Synthesia

Каждой компании нужны видео — обучение сотрудников, внутренние коммуникации, маркетинг, продуктовые туториалы. Стандартный путь:

  • Найти актёра, оператора, локацию
  • Снять, смонтировать, обработать
  • На каждое обновление — пересъёмка
  • Локализация на 10 языков = 10 переснятых видео

Каждое видео — недели работы и тысячи долларов.

Synthesia сжимает это до минут:

  • Загрузил текст
  • Выбрал аватара из библиотеки
  • Получил видео на любом языке за минуты
  • Изменил текст → новое видео за минуты

Как родилась идея

Виктор изучал research-paper 2016 года про генерацию видеокадров нейросетями. Первая идея — ИИ-дубляж: автоматическая замена губ актёра под перевод. Сложно, требует мощностей.

Через эксперименты понял: реальная боль шире — демократизация всего видеопроизводства, не только дубляжа. Любой может сделать качественное видео без камеры. Это открыло категорию: учебники → видео-курсы, внутренние документы → видео-инструкции.

Как собрали и сколько вложили

Старт: $1M первого раунда при оценке $5M post-money (инвестор — Марк Кьюбан, серийный инвестор в технологии).

Команда из 4 основателей, фокус на enterprise use-кейсах: обучение сотрудников, корпоративные коммуникации, локализация. Эти рынки готовы платить, и им нужны массовые видео.

Стек:

СлойИнструмент
ML-моделисобственные нейросети для аватаров
Языковые моделиOpenAI, Anthropic для сценариев
Инфраструктурабольшая ML-обработка на GPU

К 2024 году поднято $250M+ инвестиций, включая Series D $100M от NEA.

Стратегия роста

Вирусные ролики через TikTok

Главный B2C-канал — TikTok-инфлюенсеры, которые делали ролики через Synthesia. Десятки миллионов просмотров: «смотрите, как ИИ говорит за человека». Каждый такой ролик — бесплатная реклама + демонстрация продукта.

Почему работает: TikTok-алгоритм продвигает новое и непривычное. ИИ-аватары в 2022-2023 — именно такой контент. Зрители кликают → попадают на Synthesia → пробуют сами.

Enterprise sales — нестандартно для PLG-продукта

Большинство ИИ-стартапов делают product-led growth (PLG): бесплатный план, виральность, постепенный апгрейд. Synthesia пошли сразу в enterprise: продают L&D-командам крупных компаний.

Почему: enterprise покупают видео тоннами. Один контракт = десятки тысяч роликов в год. Это липкая выручка — сотрудник один раз внедрил, и компания платит годами.

Self-service SaaS + upsell на enterprise

Параллельно — публичный SaaS с пробным планом для команд до 10 человек. Это онбординг-воронка: малая компания пробует → растёт → подписывается на enterprise.

Это двухуровневая дистрибуция: PLG приводит лидов снизу, sales-команда закрывает сверху.

LLM-интеграция для сценариев

Synthesia добавили генерацию текста через ИИ — пользователь пишет «нужно видео про onboarding» → получает готовый сценарий → аватар озвучивает. Этот workflow сокращает время с идеи до видео до 10-15 минут.

Pricing

  • Starter — от $30/мес
  • Creator — выше, доступ к большему числу аватаров
  • Enterprise — кастомные сделки, свои аватары, API, SLA

Большая часть выручки — из enterprise-сегмента, средний контракт в десятки тысяч долларов в год.

5 уроков из кейса

  1. Research-paper может быть бизнес-идеей. Виктор взял академический paper 2016 года и построил вокруг него индустрию. Опережающее видение — главный актив на новой технологической волне.
  2. Сужение use-кейса с B2C на enterprise. Synthesia могли делать «весело видео для TikTok-блогеров». Вместо этого — фокус на обучении сотрудников и корпоративных коммуникациях. Там липкая выручка, а не разовые покупки.
  3. Двухуровневая воронка PLG + sales. TikTok-вирус приводит лидов, sales-команда закрывает enterprise-контракты. Один канал не работал бы — оба вместе дают $100M ARR.
  4. Чистые данные = enterprise-доверие. Synthesia с первого дня тренировали модели на легально полученных данных от актёров. Enterprise не купят то, что может вылиться в иск — это конкурентное преимущество.
  5. Будущее = видео, не текст. Synthesia ставят на shift от текстовой коммуникации к видео. Это долгосрочная ставка: через 5-10 лет внутренние документы будут видео по умолчанию.

Главная мысль: на новой технологической волне выигрывает не первый, а тот, кто превратит технологию в workflow. ИИ-генерация видео — это не «прикольно», а конкретная замена production-студии для корпоративного обучения. Это и забирает категорию.

Похожие идеи

  • Infography — $8K · ИИ-генерация инфографики
  • EasyGen — $33K · ИИ-генерация контента для LinkedIn
  • Fireflies.ai — $908K · ИИ-транскрибатор и саммари встреч
  • FinChat — $875K · ИИ-платформа для инвестиционных исследований
  • WeWeb — $267K · No-code конструктор веб-приложений