Опубликовано: четверг, 17 апреля 2025 г.

Создать музыку с помощью ИИ

Автор

Имя
Нейрократия
Telegram
telegram

Нейрократия

582 подписчика

236 постов

Про технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev

Создать музыку с помощью ИИ или

Сегодня я хочу поговорить о том, как машины вторгаются в святая святых — творчество.

В 1956‑м в Дартмуте учёные впервые сформулировали цель: описать любую черту человеческого интеллекта настолько точно, чтобы машина могла её симулировать. Самым сложным пунктом называли «способность к оригинальности и креативности». Тогда учёные только начинали догадываться: без «контролируемой случайности» тут не обойтись.

Спустя почти семь десятилетий именно этот рецепт воплотили diffusion‑модели. Суть метода проста — модель учится на миллионах существующих треков, каждый представлен в виде визуальной волны (waveform) или спектрограммы. Когда вы даёте подсказку — «мрачный синт‑поп с гитарным рифом» — она берёт чистый шум и кристализует его в музыкальный фрагмент. На выходе вы получаете полноценный трек, где каждый басовый удар и каждая мелодическая пауза выверены статистикой.

Лидеры гонки — стартапы Udio и Suno. Первый привлёк $10 млн от фонда Andreessen Horowitz, второй — получил $125 млн и завёл партнёрство с Тимбалэндом. Оба обещают — музыкальный бэкграунд не нужен, достаточно грамотного промптинга. Аудитория отзывается: на стримингах уже появляются «исполнители», чьи треки генерируются полностью ИИ, а подписчики лайкают и делятся ими точно так же, как релизами реальных групп.

На кону — философия творчества. Психологи ещё в 1950‑х предлагали считать творческим то, что одновременно ново и полезно. Позднее к этому добавили «неожиданность». Нейробиологи из Harvard Medical School показали: творческие процессы распределены по мозговым нейронным сетям и ключевым оказалось умение устанавливать «семантические мосты» между далёкими концептами — как если бы активировалось сразу несколько отдалённых узлов памяти.

ИИ в этом плане — чистый статистик: он выдаёт то, что встречалось чаще всего в похожих контекстах, слегка приправляя «случайностью» по ходу дела. Он не умеет «усиливать аномалию», как в последнем такте Симфонии № 8 Бетховена, не переживает о прошлом и не вкладывает в музыку личную драму.

Я сам писал музыку (по старинке, без ИИ), и мне есть, с чем сравнивать: уровень композиций, которые выдаёт Suno или Riffusion, пока что нельзя назвать хитовым, качество походит на эфир «Русского радио» 2015 года (что уже неплохо, конечно, но всё же). Однако если учитывать возможности создавать десятки треков в час по 10 центов за каждый включая тексты — возможно, качество тут и не самое важное.

Сергей Пименов, легенда электронной музыкальной сцены, участник ППК

, уверен, что «искусственная» музыка найдёт своё место так или иначе:

Генеративная музыка — это прекрасно, свою тему закрывает, применений масса. Для быстрых идей круто, для людей, которые нот не знают, но хотят себя творчески реализовать — отличная тема. Для рилсов всяких. В общем, я одобряю. Музыка разная нужна.

И действительно, есть генераторы музыки, которые не претендуют на творчество, а выполняют утилитарную функцию — подзвучка для видео без проблем с авторскими правами (Mubert), фон для различной активности (Endel). Недавно Youtube анонсировали собственный сервис Music assistant для быстрого создания фоновых композиций для роликов.

Я считаю, что будущее музыки — в гипер-персонализированном стриме, 24/7 генерирующемся в реальном времени по вашим предпочтениям — становясь всё лучше и лучше.

А ещё — в редких композициях, написанных человеком или машиной — неважно, которыми вы захотите поделиться, захотите переслушать, захотите оторваться от бесконечного потока создаваемых для вас мелодий.

Человеку нужны эмоциональные якори и социализация через творчество, а переизбыток даже самого качественного контента в конечном итоге вызывает отторжение.

— Подписаться

Обсудить в Telegram

Нейрократия

582 подписчика

236 постов

Про технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev