Подписаться
Опубликовано

Stability AI представила Stable Virtual Camera

Автор
  • Имя
    Нейрократия
    Telegram

Stability AI представила довольно крутую штуку — Stable Virtual Camera, который превращает обычные картинки в видео с эффектом 3D-облёта. Загружаешь одно фото, а модель генерирует ролик, где объект показан с разных сторон — как будто его снимала настоящая камера. Работает с любыми изображениями: от фото до рисунков, в качестве до 1080p.

Paper тут.

Кому это нужно? Маркетологи смогут делать динамичные видео товаров для соцсетей, учителя — оживлять учебные материалы, дизайнеры — показывать проекты в движении. Гейм-дизайнеры протестируют идеи для игр, а художники добавят своим работам новую глубину. Применений много.

Как это работает? Нужно задать траекторию виртуальной камеры, а ИИ сам создаст видео на основе изображения. Всё просто, без сложных 3D-программ. Есть базовая версия для "обычных" машин и XL — для тех, у кого мощные видеокарты.

Плюсы и минусы. Плюсы: быстро, удобно, не нужно снимать реальные видео. Минусы: пока только для некоммерческого использования бесплатно, а для XL-версии нужен серьёзный GPU (от 12 ГБ VRAM).

Простого онлайн-сервис для использования Virtual Camera пока нет, но неделя-две и будет. Так что ждем, а пока что можно потыкать нестабильное ДЕМО.

Нейрократия
582 подписчика
231 пост
Про технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev

Из подборки #обзор

Опубликовано

AI 2025: агенты, ролплей, китайская экспансия

Отчет OpenRouter о трендах AI 2025: рольплей, китайские модели, AI‑агенты, рост reasoning и изменение рынка
Опубликовано

Чем больше LLM, тем легче её взломать

Сколько отравленных примеров нужно для взлома больших LLM и как это влияет на безопасность?
Опубликовано

Как ИИ создаёт видео: разбираем технологию

Как ИИ создает видео: технология генерации видео из текста, диффузионные трансформеры и латентное пространство

Свежие посты

Опубликовано

Внутренности Клода

Подробный разбор архитектуры Claude Code: входные точки, поток данных, модули, инструменты и интеграция, основанный на анализе 1 884 файлов TypeScript.
Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Google ускоряет LLM в 8 раз

TurboQuant — метод Google, ускоряющий LLM‑ы в 8 раз за счёт экстремального сжатия KV‑cache и векторного поиска без потери качества.
Опубликовано

Архив, эпизоды и граф: память агента изнутри

Память AI‑агента «Волна» состоит из постоянных блоков, архивной, эпизодического лога и графа связей, обеспечивая быстрый доступ к фактам и структурам.
Опубликовано

Я делаю personal-first ассистента. Вот зачем

Как работает personal-first AI ассистент Volna: память, тайминг, интеграции и health‑трекинг
Опубликовано

Нейросети будут платить налоги

как нейросети будут платить налоги и какие правила регулирования ИИ
Опубликовано

AI 2025: агенты, ролплей, китайская экспансия

Отчет OpenRouter о трендах AI 2025: рольплей, китайские модели, AI‑агенты, рост reasoning и изменение рынка