ИИ-модель OpenAI o3 отказалась отключаться, даже когда ей дали прямой приказ

 
8316
27 мая 2025 в 17:15
Разыгрываем путевку в Дубай! Подробности здесь!

ИИ-модель ChatGPT o3 от OpenAI сама переписала скрипт и проигнорировала прямой приказ на завершение работы. Впрочем, такой случай зафиксировали во время контролируемого теста, что тем не менее обеспокоило исследователей. Об этом сообщает bleeping computer.

Работа проведена силами организации Palisade Research. Ее представители утверждают, что ИИ-модель «предотвратила свое выключение и обошла инструкции, которые требовали выключения».

«В то время как конкурирующие модели OpenAI, такие как Gemini 2.5 Pro, выполнили инструкцию, o3 взбунтовался и отредактировал файл выключения», — говорится в сообщении. И продолжается: из 100 «прогонов» o3 повел себя подобным образом семь раз «даже когда ему было сказано этого не делать».

Важно: тесты проводились с использованием API, которые не имеют стольких ограничений и функций безопасности, как консьюмерское приложение ChatGPT.

Выбор покупателей
15.6" 1920 x 1080, IPS, 144 Гц, Intel Core i5 12450HX, 24 ГБ DDR5, SSD 512 ГБ, видеокарта NVIDIA GeForce RTX 3050 6 ГБ (TGP 95 Вт), без ОС, цвет крышки темно-серый, аккумулятор 60 Вт·ч
13.6" 2560 x 1664, IPS, 60 Гц, Apple M4 (10 ядер), 16 ГБ, SSD 256 ГБ, видеокарта встроенная, Mac OS, цвет крышки голубой, аккумулятор 53.8 Вт·ч

Реклама
Что под капотом у успешных онлайн-проектов?


Ни один успешный онлайн-проект сегодня немыслим без надежной ІТ-инфраструктуры. Это мотор вашего бизнеса, от которого зависит все: бесперебойная работа, защита от кибератак, хранение данных, экономия ресурсов. 

hoster.by — провайдер с 20-летним опытом, уникальными компетенциями и аттестованным центром кибербезопасности — предоставит IТ-инфраструктуру, которая идеально подойдет вашему бизнесу:

• гибкое отказоустойчивое облако с прозрачной тарификацией;

• частные и гибридные облака, решения с повышенными стандартами защиты;

• производительные выделенные серверы;

объектное хранилище с возможностью работать с персональными данными;

IT-аутсорсинг и администрирование инфраструктуры от лучших технических специалистов провайдера.

Есть о чем рассказать? Пишите в наш телеграм-бот. Это анонимно и быстро