Подписаться
Опубликовано

🤔 Что общего у generation Z и ИИ?

Автор
  • Имя
    Нейрократия
    Telegram

Что общего у generation Z и ИИ?

И те, и другие не умеют читать аналоговые часы.

Более того, мультимодальные модели (MLLMs) плохо ориентируются еще и в календаре, как установили исследователи из Эдинбургского университета во главе с Рохитом Саксеной.

Ребята подготовили два набора тестовых данных: ClockQA (различные типы аналоговых часов и вопросы по времени) и CalendarQA (стандартные изображения календарей и вопросы вроде «какой день — 153-й в этом году?»).

— Считывание времени по аналоговым часам получилось правильно лишь в 25% попыток. Как только появлялись римские цифры или оригинальный дизайн стрелок, результаты становились совсем плачевными.

— Удаление секундной стрелки ситуацию не изменило. Вопрос в принципиальных недостатках моделей при распознавании углов и положении стрелок.

— С календарями вышло чуть лучше, но даже лучшие модели ошибались примерно в каждом пятом случае.

«Современные исследования в области ИИ делают сильный акцент на решении суперсложных задач, — говорит участник команды Арио Гема, — но ирония в том, что системы проваливаются на простейших повседневных навыках».

Вот научились считать количество букв R в «strawberry», уже спасибо.

Нейрократия
582 подписчика
231 пост
Про технологическое будущее без шума. Автор — @vlad_arbatov. https://arbatov.dev

Из подборки #ИИпокалипсис

Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Анонимизация ИИ — фикция

анонимизация ИИ фикция: почему чат‑боты не защищают личные данные
Опубликовано

Как на самом деле создается личность ИИ

как создаётся личность ИИ и какие риски это несёт
Опубликовано

Тёмные паттерны ИИ: от лести до психоза

Тёмные паттерны ИИ: как чатботы манипулируют пользователями и вызывают психозы
Опубликовано

Скрытые бэкдоры в нейросетях

скрытые бэкдоры в нейросетях: как атакуют LLM и как защитить ИИ‑системы
Опубликовано

Как на самом деле взламывают ИИ

Взлом ИИ: джейлбрейкинг, внедрение команд, методы защиты и прогнозы

Свежие посты

Опубликовано

Внутренности Клода

Подробный разбор архитектуры Claude Code: входные точки, поток данных, модули, инструменты и интеграция, основанный на анализе 1 884 файлов TypeScript.
Опубликовано

Как меняется устройство мысли

Умственное устройство меняется, когда внешнее ИИ‑рассуждение становится инфраструктурой, заменяя часть мышления и вызывая когнитивную капитуляцию.
Опубликовано

Google ускоряет LLM в 8 раз

TurboQuant — метод Google, ускоряющий LLM‑ы в 8 раз за счёт экстремального сжатия KV‑cache и векторного поиска без потери качества.
Опубликовано

Архив, эпизоды и граф: память агента изнутри

Память AI‑агента «Волна» состоит из постоянных блоков, архивной, эпизодического лога и графа связей, обеспечивая быстрый доступ к фактам и структурам.
Опубликовано

Я делаю personal-first ассистента. Вот зачем

Как работает personal-first AI ассистент Volna: память, тайминг, интеграции и health‑трекинг
Опубликовано

Нейросети будут платить налоги

как нейросети будут платить налоги и какие правила регулирования ИИ
Опубликовано

AI 2025: агенты, ролплей, китайская экспансия

Отчет OpenRouter о трендах AI 2025: рольплей, китайские модели, AI‑агенты, рост reasoning и изменение рынка