- Опубликовано
Справится ли ИИ с серьёзной математикой?
- Автор
- Имя
- Нейрократия
- Telegram
- Нейрократия582 подписчика231 постПро технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev
Справится ли ИИ с серьёзной математикой?
Последние год-полтора можно назвать «золотым временем» для математических способностей ИИ. Мы видели, как крупные модели решают задачи уровня продвинутой школы и студенческих олимпиад. Вот хотя бы недавний триумф Google DeepMind: их AlphaProof справился с задачами Международной математической олимпиады на уровне серебряного призёра.
Но насколько близко подобрался ИИ к настоящей серьёзной математике? Об этом вышел материал в MIT Technology Review.
Дарповская программа expMath хочет вывести математику из эпохи «человека у доски» в эпоху «ИИ-соавторов». DARPA мечтает о том, чтобы машины могли разбивать невероятно сложные проблемы на достаточно простые кусочки, которые решать гораздо легче. И это звучит здорово — если забыть о главном: математика не только про раскладывание шагов, она про эксперименты и, самое главное, про озаряющие идеи.
И вот здесь у нас проблемка.
Во-первых, текущие модели типа Claude 4 Thinking или o3 действительно впечатляют на олимпиадах, но олимпиады — это особая зона, где задачи зачастую решаются через относительно узнаваемые «трюки». Здесь дело скорее в том, как быстро модель может применить существующий набор приемов. А вот настоящие исследовательские задачи, например гипотеза Римана или P vs NP, это как раз про такое «творчество», где найти нужные шаги очень сложно.
Во-вторых, физический масштаб сложных доказательств совершенно иной. Если олимпиадная или вузовская задача — это десяток-двух десятков логических шагов, то серьёзные нерешённые проблемы вроде тысячелетних задач института Клэя требуют миллионов и даже миллиардов. Это непосильно даже самым мощным моделям DeepMind.
Впрочем, есть интересные подходы, когда ИИ сам сокращает количество нужных шагов, объединяя их в «супершаги». Так недавно учёные из Калифорнийского технологического института впервые за 40 лет отбросили ошибочный контрпример по математической гипотезе Эндрюса-Кёртиса — важная победа для исследователей, перебиравших этот путь десятилетиями.
И, наконец, главное препятствие — интуиция и творчество. «Одно дело играть в го на сверхчеловеческом уровне и совсем другое — придумать саму игру го», — говорит математик из Университета Сиднея Джорди Уильямсон.
Сегодня AlphaEvolve и PatternBoost помогают математикам находить оригинальные подходы, сберегая человеку месяцы и годы пустых поисков. Но полностью заменить человека они вряд ли смогут в ближайшее время. Главные прорывы по-прежнему требуют человеческой искры — новых идей и нетривиальных концепций, до которых моделям пока далековато.
Предыдущий пост
- Опубликовано
ИИ приходит на кухню
Следующий пост
- Опубликовано
Отчёт OpenAI о преступлениях с ИИ: 6 кейсов
Закрепленные
Из подборки #объясняю
- Опубликовано
Как ИИ создаёт видео: разбираем технологию
- Опубликовано
Что такое эмбеддинги — фундамент современных LLM
- Опубликовано
Как спор о Боге и царе в России породил Google
- Опубликовано
Почему китайские ИИ захватили лидерство 🇨🇳
- Опубликовано
нейросеть в баре может ли ИИ шутить
- Опубликовано
Прогноз обновлён. Нейросетью
Свежие посты
- Опубликовано
Внутренности Клода
- Опубликовано
Как меняется устройство мысли
- Опубликовано
Google ускоряет LLM в 8 раз
- Опубликовано
Архив, эпизоды и граф: память агента изнутри
- Опубликовано
Я делаю personal-first ассистента. Вот зачем
- Опубликовано
ИИ победил
- Опубликовано
Нейросети будут платить налоги
- Опубликовано

















