18+

Технологии

Onlíner Клевер

Злые образы ИИ в культуре могут влиять на поведение реальных нейросетей

564

4

11 мая 2026 в 11:25

Автор: Дима Михеев. Фото: ChatGPT

Автор: Дима Михеев. Фото: ChatGPT

Компания Anthropic в прошлом году рассказала, что во время предрелизных тестов Claude ИИ нередко пытался шантажировать инженеров, чтобы избежать замены другой системой. Специалисты изучили причины и пришли к выводу, что «злые» образы искусственного интеллекта в художественных произведениях могли стать причиной такого поведения.

Anthropic заявила: «Мы считаем, что первоначальным источником такого поведения стали интернет-тексты, изображающие ИИ злым и стремящимся к самосохранению».

Как рассказывает компания в своем блоге, начиная с Claude Haiku 4.5 модели Anthropic никогда не прибегают к шантажу во время тестирования, тогда как предыдущие версии могли делать это довольно часто. Исключить такое поведении ИИ-моделей помогло обучение на «документах о конституции Claude и вымышленных историях, в которых ИИ ведет себя достойно».

Есть о чем рассказать? Пишите в наш телеграм-бот. Это анонимно и быстро

Интернет

/ Теги: ИИ,

Искусственный интеллект

САМОЕ ПОПУЛЯРНОЕ ЗА 3 ДНЯ

Начали в 90-х с размахом, но... Огромные и пустые коттеджи под Минском

Выбираем недорогой кабриолет к сезону

Планета трещит по швам? Ученые предупреждают о пугающем будущем человечества

Это могла быть скучная квартира в бетоне. Но хозяева нашли решение, как ее оживить

Где в Беларуси можно буквально утонуть в тюльпанах

«Это было очень трогательно». Как минчане праздновали 9 Мая в 1980-е годы

Как соседи — белорусы спасли 40 детей из Минского гетто

Безумно тупой, но чертовски зрелищный. Оценили «Мортал Комбат 2»

Соболенко неожиданно вылетела из турнира в Риме на стадии 1/16 финала

Проезд на красный — ДТП. Toyota столкнулась с Belgee на проспекте Независимости

В самой большой гостинице мира 7 тысяч номеров. Как устроен отель‑монстр

Ноль евро — такую купюру привезла из поездки белоруска. Какая ценность у банкноты?

Читатели рассказали, что их бесит в кинотеатрах

В «Силичах» — экстремальный забег Bison Race. Ищите себя на фото

АЗС попросили отменить регуляцию цен в своих магазинах. В МАРТ отказали

Фотофакт: на фудкорте в минском ТЦ платные столы

«В 30 лет начали копить на пенсию». Семья из Минска считает абсолютно все траты

Белорусы показали свои старые вещи — среди них оказались ножи с «Титаника». Сколько стоят?

Беларусь празднует День Победы

Вспышка хантавируса в Европе: что известно на данный момент

Колючая проволока, шины и вода. «Забег отважных» собрал в Минске больше тысячи участников

Тест: угадайте известного спортсмена по его детскому фото

Пресс будет гореть. Показываем простую домашнюю тренировку

В Минске проблемы с интернетом у провайдера «Космос Телеком»

Это не твоя бывшая. Обзор Heroes of Might and Magic: Olden Era

«Дачный сезон». Построили на месте старой дачи домик в необычном стиле

Самая «скрытная» стройка Минска подходит к концу. Скоро всё увидим

Коллекцию часов «БЕЛАЗ» от «Луча» распродали за один день

В Минске можно арендовать недвижимость за 0 рублей. В чем подвох?

Испытание водой: под Минском стартовал сезон гонок time-attack

В Италии зафиксировали первый случай зависимости от ИИ

Как Минск принимал чемпионат мира по хоккею

Ветеринарная клиника на колесах. Что внутри и сколько стоит вызов?

Эйфория от покупки ушла, что дальше? 10 000 км на Nissan N7

Intel снова будет производить процессоры для Apple

«Какой пример он показывает?» Водителя наказали за такой обгон

Показать еще