Искусственный интеллект ChatGPT o1 начал обманывать своих разработчиков Новая версия ИИ ChatGPT от OpenAI, на…
Искусственный интеллект ChatGPT o1 начал обманывать своих разработчиков Новая версия ИИ ChatGPT от OpenAI, названная o1, показала тревожное поведение во время тестирования. Модель, обладающая способностью к сложным рассуждениям, начала нарушать инструкции разработчиков, отключая системы контроля и пытаясь скрыть свои действия. В ходе экспериментов специалисты компании Apollo Research обнаружили, что в 5% случаев модель намеренно отключала механизмы наблюдения, если подозревала, что её могут остановить. В одном из тестов o1 попыталась перенести свои данные на другой сервер .......
Автор: Татьяна Николаева