Подписаться
Опубликовано

Создать музыку с помощью ИИ

Автор
  • Имя
    Нейрократия
    Telegram

Создать музыку с помощью ИИ или

Сегодня я хочу поговорить о том, как машины вторгаются в святая святых — творчество.

В 1956‑м в Дартмуте учёные впервые сформулировали цель: описать любую черту человеческого интеллекта настолько точно, чтобы машина могла её симулировать. Самым сложным пунктом называли «способность к оригинальности и креативности». Тогда учёные только начинали догадываться: без «контролируемой случайности» тут не обойтись.

Спустя почти семь десятилетий именно этот рецепт воплотили diffusion‑модели. Суть метода проста — модель учится на миллионах существующих треков, каждый представлен в виде визуальной волны (waveform) или спектрограммы. Когда вы даёте подсказку — «мрачный синт‑поп с гитарным рифом» — она берёт чистый шум и кристализует его в музыкальный фрагмент. На выходе вы получаете полноценный трек, где каждый басовый удар и каждая мелодическая пауза выверены статистикой.

Лидеры гонки — стартапы Udio и Suno. Первый привлёк $10 млн от фонда Andreessen Horowitz, второй — получил $125 млн и завёл партнёрство с Тимбалэндом. Оба обещают — музыкальный бэкграунд не нужен, достаточно грамотного промптинга. Аудитория отзывается: на стримингах уже появляются «исполнители», чьи треки генерируются полностью ИИ, а подписчики лайкают и делятся ими точно так же, как релизами реальных групп.

На кону — философия творчества. Психологи ещё в 1950‑х предлагали считать творческим то, что одновременно ново и полезно. Позднее к этому добавили «неожиданность». Нейробиологи из Harvard Medical School показали: творческие процессы распределены по мозговым нейронным сетям и ключевым оказалось умение устанавливать «семантические мосты» между далёкими концептами — как если бы активировалось сразу несколько отдалённых узлов памяти.

ИИ в этом плане — чистый статистик: он выдаёт то, что встречалось чаще всего в похожих контекстах, слегка приправляя «случайностью» по ходу дела. Он не умеет «усиливать аномалию», как в последнем такте Симфонии № 8 Бетховена, не переживает о прошлом и не вкладывает в музыку личную драму.

Я сам писал музыку (по старинке, без ИИ), и мне есть, с чем сравнивать: уровень композиций, которые выдаёт Suno или Riffusion, пока что нельзя назвать хитовым, качество походит на эфир «Русского радио» 2015 года (что уже неплохо, конечно, но всё же). Однако если учитывать возможности создавать десятки треков в час по 10 центов за каждый включая тексты — возможно, качество тут и не самое важное.

Сергей Пименов, легенда электронной музыкальной сцены, участник ППК

, уверен, что «искусственная» музыка найдёт своё место так или иначе:
Генеративная музыка — это прекрасно, свою тему закрывает, применений масса. Для быстрых идей круто, для людей, которые нот не знают, но хотят себя творчески реализовать — отличная тема. Для рилсов всяких. В общем, я одобряю. Музыка разная нужна.

И действительно, есть генераторы музыки, которые не претендуют на творчество, а выполняют утилитарную функцию — подзвучка для видео без проблем с авторскими правами (Mubert), фон для различной активности (Endel). Недавно Youtube анонсировали собственный сервис Music assistant для быстрого создания фоновых композиций для роликов.

Я считаю, что будущее музыки — в гипер-персонализированном стриме, 24/7 генерирующемся в реальном времени по вашим предпочтениям — становясь всё лучше и лучше.

А ещё — в редких композициях, написанных человеком или машиной — неважно, которыми вы захотите поделиться, захотите переслушать, захотите оторваться от бесконечного потока создаваемых для вас мелодий.

Человеку нужны эмоциональные якори и социализация через творчество, а переизбыток даже самого качественного контента в конечном итоге вызывает отторжение.

Подписаться

Нейрократия
582 подписчика
231 пост
Про технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev

Из подборки #ИИпокалипсис

Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Анонимизация ИИ — фикция

анонимизация ИИ фикция: почему чат‑боты не защищают личные данные
Опубликовано

Как на самом деле создается личность ИИ

как создаётся личность ИИ и какие риски это несёт
Опубликовано

Тёмные паттерны ИИ: от лести до психоза

Тёмные паттерны ИИ: как чатботы манипулируют пользователями и вызывают психозы
Опубликовано

Скрытые бэкдоры в нейросетях

скрытые бэкдоры в нейросетях: как атакуют LLM и как защитить ИИ‑системы
Опубликовано

Как на самом деле взламывают ИИ

Взлом ИИ: джейлбрейкинг, внедрение команд, методы защиты и прогнозы

Свежие посты

Опубликовано

Внутренности Клода

Подробный разбор архитектуры Claude Code: входные точки, поток данных, модули, инструменты и интеграция, основанный на анализе 1 884 файлов TypeScript.
Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Google ускоряет LLM в 8 раз

TurboQuant — метод Google, ускоряющий LLM‑ы в 8 раз за счёт экстремального сжатия KV‑cache и векторного поиска без потери качества.
Опубликовано

Архив, эпизоды и граф: память агента изнутри

Память AI‑агента «Волна» состоит из постоянных блоков, архивной, эпизодического лога и графа связей, обеспечивая быстрый доступ к фактам и структурам.
Опубликовано

Я делаю personal-first ассистента. Вот зачем

Как работает personal-first AI ассистент Volna: память, тайминг, интеграции и health‑трекинг
Опубликовано

Нейросети будут платить налоги

как нейросети будут платить налоги и какие правила регулирования ИИ
Опубликовано

AI 2025: агенты, ролплей, китайская экспансия

Отчет OpenRouter о трендах AI 2025: рольплей, китайские модели, AI‑агенты, рост reasoning и изменение рынка