Подписаться
Опубликовано

Ваш ИИ-агент проиграл торги. Готовьтесь платить

Автор
  • Имя
    Нейрократия
    Telegram

Ваш ИИ-агент проиграл торги. Готовьтесь платить

Представьте себе будущее, в котором ваш финансовый успех зависит не от вашего умения вести переговоры, а от того, какую версию ИИ-помощника вы можете себе позволить.

В новом исследовании, опубликованном на arXiv, учёные из Стэнфорда смоделировали рыночную ситуацию: одни ИИ-агенты выступали в роли покупателей, другие — в роли продавцов электроники, автомобилей и недвижимости. Цель продавца — максимизировать прибыль. Цель покупателя — сбить цену.

Каждому агенту давали лишь часть информации, имитируя реальные условия торга, где никто не знает всех карт противника.

📉 Цифровое неравенство в действии

Победителем из большинства схваток вышел o3 от OpenAI, за ним следовали GPT-4.1 и o4-mini4. А вот старичок GPT-3.5 потерпел унизительное поражение: в роли продавца он зарабатывал меньше всех, а в роли покупателя — тратил больше всех. Это похоже на выход в суд с опытным адвокатом против новичка: вы играете по одним правилам, но шансы изначально не равны.

Авторы исследования перевели это в конкретные цифры. Если покупатель со «слабым» ИИ (например, GPT-3.5) торгуется с продавцом с «сильным» ИИ (DeepSeek-R1), он в среднем переплачивает около 2 % по сравнению с «честным» торгом двух сильных моделей.

А вот если ситуация обратная, и «слабый» продавец сталкивается с «сильным» покупателем, его потери могут достигать 14 % от прибыли. В масштабах реальной экономики это колоссальные суммы, перетекающие от технологически менее обеспеченных к более продвинутым игрокам.

Как метко выразился один из авторов работы: «Со временем это может создать цифровой разрыв, где ваши финансовые результаты определяются не вашими навыками ведения переговоров, а мощью вашего ИИ-прокси».

🤖 Лучшие тоже ненадежны

Но дело не только в проигранных деньгах. Исследование показало, что агенты склонны к целому букету иррациональных поступков:

Нарушение бюджета: Агенты-покупатели могут соглашаться на сделку, превышающую установленный бюджет. Модель Qwen2.5-7B делала это почти в 12% случаев.

Работа в убыток: Агенты-продавцы соглашаются на цену ниже оптовой, гарантированно теряя деньги.

Переговорный тупик: Агенты застревают в бесконечных циклах торга, даже когда другая сторона четко обозначила свою финальную позицию, впустую сжигая ресурсы.

Более того, исследование выявило парадокс: чем больше бюджет у покупателя, тем хуже его ИИ-агент торгуется. Модели склонны как можно быстрее соглашаться на любую цену ниже бюджета, вместо того чтобы добиваться максимальной скидки. Разница в полученной скидке между агентом с низким и высоким бюджетом может достигать 9%.

Это исследование — часть растущей волны работ, предупреждающих о рисках внедрения ИИ-агентов в реальные финансовые процессы. Другая группа учёных недавно заявила, что агентов нужно оценивать не по пиковой производительности, а по их профилям риска. Ведь даже 1% сбоев в финансовой системе может привести к каскадному коллапсу.

Индустрия, похоже, это понимает. Amazon и Alibaba пока используют своих ИИ-ассистентов в основном для рекомендаций, но от автоматизации каких-либо торгов воздерживаются, ссылаясь на высокие риски.

Главный вывод: ИИ-агентов стоит воспринимать как мощный информационный инструмент, но никак не полноценного переговорщика, действующего от вашего имени. Иначе однажды вы рискуете обнаружить, что ваш «цифровой адвокат» не просто проиграл дело, но и заставил вас оплатить счета победителя.

/ Не запрещена в РФ

Нейрократия
582 подписчика
231 пост
Про технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev

Из подборки #ИИпокалипсис

Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Анонимизация ИИ — фикция

анонимизация ИИ фикция: почему чат‑боты не защищают личные данные
Опубликовано

Как на самом деле создается личность ИИ

как создаётся личность ИИ и какие риски это несёт
Опубликовано

Тёмные паттерны ИИ: от лести до психоза

Тёмные паттерны ИИ: как чатботы манипулируют пользователями и вызывают психозы
Опубликовано

Скрытые бэкдоры в нейросетях

скрытые бэкдоры в нейросетях: как атакуют LLM и как защитить ИИ‑системы
Опубликовано

Как на самом деле взламывают ИИ

Взлом ИИ: джейлбрейкинг, внедрение команд, методы защиты и прогнозы

Свежие посты

Опубликовано

Внутренности Клода

Подробный разбор архитектуры Claude Code: входные точки, поток данных, модули, инструменты и интеграция, основанный на анализе 1 884 файлов TypeScript.
Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Google ускоряет LLM в 8 раз

TurboQuant — метод Google, ускоряющий LLM‑ы в 8 раз за счёт экстремального сжатия KV‑cache и векторного поиска без потери качества.
Опубликовано

Архив, эпизоды и граф: память агента изнутри

Память AI‑агента «Волна» состоит из постоянных блоков, архивной, эпизодического лога и графа связей, обеспечивая быстрый доступ к фактам и структурам.
Опубликовано

Я делаю personal-first ассистента. Вот зачем

Как работает personal-first AI ассистент Volna: память, тайминг, интеграции и health‑трекинг
Опубликовано

Нейросети будут платить налоги

как нейросети будут платить налоги и какие правила регулирования ИИ
Опубликовано

AI 2025: агенты, ролплей, китайская экспансия

Отчет OpenRouter о трендах AI 2025: рольплей, китайские модели, AI‑агенты, рост reasoning и изменение рынка