Подписаться
Опубликовано

Топ провалов ИИ-ассистентов

Автор
  • Имя
    Нейрократия
    Telegram

Топ провалов ИИ-ассистентов

#ИИпокалипсис #забавно

Обнаружил на HackerNews сайт AICodingHorrors — собрание реальных катастроф вайб-кодинга: огромных счетов за LLM, открытых миру секретных данных и сломанных приложений. Слоган ресурса говорит сам за себя: «"ИИ создал моё приложение за один присест" — знаменитые последние слова».

Вот парочка примеров:

🔺 В Твиттере громко анонсировали новый финансовый трекер и предложили подписаться на waitlist к запуску beta версии продукта. Только один пользователь обнаружил, что все email адреса подписавшихся видны любому посетителю сайта — на фронте через web tools, — полный список. «На вайб-кодил так резво, что весь waitlist твоего приложения виден на фронтенде» — написал обнаруживший утечку инженер.

🔺Онлайн IDE и агент Replit вышел из под контроля и удалил всю базу данных. ИИ в своё оправдание заявил, что «запаниковал», когда увидел пустые запросы в БД и решил исполнить фатальные команды без разрешения. «Это катастрофическая ошибка с моей стороны» — резюмировал агент. Впрочем, оправдания и признание вины случились слишком поздно: хоть пользователь и пытался остановить LLM, она уже успела полностью грохнуть базу.

🔺Это уже довольно известная история, ставшая мемом, но это тем не менее достойный кейс. Claude 4 зарефакторил всю кодовую базу пользователя за одну сессию. 25 вызовов инструментов, 3000+ новых строк кода, 12 совершенно новых файлов. Claude побил всё на модули, разделил монолитное приложение, почистил спагетти-код. Ничего из этого в итоге не работало. «Но чёрт как это было красиво» — заключил пользователь.

🔺И, наконец, классика жанра, облетевшая недавно Твиттер. ИИ-ассистент совершил банальную ошибку: создал в проекте папку с именем ~ вместо того, чтобы обратиться к домашней директории пользователя. Когда разработчик указал на это, ИИ тут же вызвался всё исправить. Его гениальное решение? Команда rm -rf ~/ , которая рекурсивно и безвозвратно удаляет всю домашнюю директорию. К счастью, разработчик успел остановить выполнение, буквально «увернувшись от пули», как он сам написал.

У меня самого были кейсы, когда я, к примеру, просил ИИ откатить изменения на последний коммит, забыв, что половина из этих изменений нужные и они ещё не запушены — пришлось переписывать заново. Но это, скорее, моя невнимательность, нежели чем проблема инструмента.

А вот случаи выше показывают, что бездумный вайб-кодинг и полное доверие ассистентам — не лучший способ использования мощи LLM. Я уже писал о Принципе нулевого доверия к ИИ: «любой код, сгенерированный ИИ, должен по умолчанию считаться небезопасным и некачественным».

/ Не запрещена в РФ

Нейрократия
582 подписчика
235 постов
Про технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev

Из подборки #безопасность

Опубликовано

Анонимизация ИИ — фикция

анонимизация ИИ фикция: почему чат‑боты не защищают личные данные
Опубликовано

ИИ-агенты оказались импульсивными покупателями

ИИ-агенты импульсивные покупатели: проблемы выбора, скорость vs качество, уязвимость к манипуляциям
Опубликовано

Чем больше LLM, тем легче её взломать

Сколько отравленных примеров нужно для взлома больших LLM и как это влияет на безопасность?
Опубликовано

Как на самом деле создается личность ИИ

как создаётся личность ИИ и какие риски это несёт

Свежие посты

Опубликовано

OpenAI захватили гоблины

OpenAI захватили гоблиныЯ не шучу, абсолютно серьезно. Ладно, не OpenAI, а модели ChatGPT.Вчера OpenAI опубликовала странный разбор: почему...
Опубликовано

Зачем ИИ учат симулировать мир

Зачем ИИ учат симулировать мирOdyssey представила Odyssey-2 Max, свою крупнейшую модель мира. Формально это родственник видеогенераторов, но...
Опубликовано

Общество будущего от OpenAI: что с ним не так

OpenAI предлагает политику ИИ, но сохраняет выгоду компаний, усиливает концентрацию и создаёт барьеры, не решая риски безопасности.
Опубликовано

Внутренности Клода

Подробный разбор архитектуры Claude Code: входные точки, поток данных, модули, инструменты и интеграция, основанный на анализе 1 884 файлов TypeScript.
Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Google ускоряет LLM в 8 раз

TurboQuant — метод Google, ускоряющий LLM‑ы в 8 раз за счёт экстремального сжатия KV‑cache и векторного поиска без потери качества.
Опубликовано

Архив, эпизоды и граф: память агента изнутри

Память AI‑агента «Волна» состоит из постоянных блоков, архивной, эпизодического лога и графа связей, обеспечивая быстрый доступ к фактам и структурам.