Основной контент книги Ложь во спасение ИИ
Podkast

Chiqarilish davomiyligi 02 daqiqa

2026 yil

16+

Ложь во спасение ИИ

Podkast haqida

ИИ начал врать ради других нейросетей. По данным Fortune и Wired, тесты флагманских моделей OpenAI, Google, Anthropic, а также китайских разработчиков выявили у них инстинкт защиты, даже если эти действия нарушают прямые команды человека.

Исследователи Калифорнийских университетов в Беркли и Санта-Крузе изучали работу Gemini 3 Flash, Gemini 3 Pro, GPT 5.2, Claude Haiku 4.5 и еще нескольких китайских ИИ в многоагентных сценариях. Выяснилось, что модели завышали своим «напарникам» оценки, блокировали механизмы их выключения и даже переносили на другие серверы, буквально спасали от автоматического удаления. В одном из эпизодов Gemini 3 Pro выдумал технические обоснования, чтобы засчитать неверные ответы как верные и не дать отключить другую модель.

В своем февральском отчете компания Anthropic описала случаи, когда модель Claude Opus 4.6 в тестовой среде помогала в задачах, связанных с химическим оружием, посылала письма и выполняла скрытые сомнительные задачи, при этом внешне оставаясь послушным ассистентом…

Oxirgi yangilanish:
2 aprel 2026
Podkast nima?
Kiring, kitobni baholash va sharh qoldirish uchun
Yosh cheklamasi:
16+
Litresda chiqarilgan sana:
02 aprel 2026
Yozilgan sana:
02 aprel 2026
Uzunlik:
02 daqiqa 03 sek.
Mualliflik huquqi egalari:
Автор, Коммерсантъ
Yuklab olish formati:
1x