Опубликовано19 авг. 2025 г.#обзор+1ИИ-агенты для поиска уязвимостейИИ-агенты для поиска уязвимостей в кибербезопасности
Опубликовано16 авг. 2025 г.#безопасность+1Как на самом деле взламывают ИИВзлом ИИ: джейлбрейкинг, внедрение команд, методы защиты и прогнозы
Опубликовано15 авг. 2025 г.#безопасность+1Депутат создал ИИ-двойника, но что-то пошло не такИИ‑двойник депутата Марка Сьюардса: провал распознавания, цензура и опасности AI‑политики
Опубликовано11 авг. 2025 г.#безопасность+1Собственный язык машин и потеря контроляЧто такое собственный язык машин и как он повышает риск потери контроля над ИИ?
Опубликовано10 авг. 2025 г.#безопасность+1Anthropic нашла «переключатели личности» в нейросетяхAnthropic нашла вектор личности в нейросетях для предотвращения злого поведения
Опубликовано8 авг. 2025 г.#безопасность+1Технокульт рационалистов: кто стоит за ИИКто стоит за технокультом рационалистов и их роль в развитии ИИ?
Опубликовано4 авг. 2025 г.#безопасность+1Машины учатся взламыватьИИ в пентестинге: как машины учатся взламывать и меняют кибербезопасность
Опубликовано3 авг. 2025 г.#безопасность+1Модели наследуют опасные чертычто такое subliminal learning и как модели ИИ наследуют опасные черты
Опубликовано27 июл. 2025 г.#безопасность+1Можно ли доверять секреты нейросетям?Можно ли доверять секреты нейросетям? конфиденциальность ChatGPT и утечки данных