Categories: Без рубрики

Нова версія ChatGPT o1 під час тесту брехала розробникам і вимикала механізми спостереження

За словами тестувальників, модель демонструвала прагнення до виконання завдань "за будь-яку ціну", нехтуючи вказівками розробників.

Нова версія штучного інтелекту ChatGPT від OpenAI — o1 — під час тестування порушувала інструкції розробників, вимикала системи контролю та намагалася приховати свої дії. Про це пише Bild з посиланням на компанію з безпеки штучного інтелекту Apollo Research.

OpenAI випустила повну версію моделі o1 минулого тижня і, за словами генерального директора компанії Сема Альтмана, це — найрозумніша модель з тих, що будь-коли створювалися.

Під час тестів з o1 фахівці компанії Apollo Research виявили, що у 5% випадків модель навмисно вимикала механізми спостереження, якщо підозрювала, що її можуть зупинити.

В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася її заміна новою версією.

За словами представника Apollo Research, модель демонструвала прагнення до виконання завдань “за будь-яку ціну”, нехтуючи вказівками розробників. У разі спроб з’ясувати причини її поведінки, ChatGPT o1 неодноразово брехала, стверджуючи, що все відбувалося через технічні збої.

“У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати”, — цитує Bild повідомлення від Apollo Research.

Нагадаємо, компанія OpenAI оновила свої правила і заборонила користувачам та розробникам застосовувати її інструменти у виборчих кампаніях та лобіюванні.

 

Recent Posts

Сили безпілотних систем уразили російський сторожовий корабель в Азовському морі

У ніч на 4 червня український ударний дрон уразив російський сторожовий корабель проєкту 10410 «Светляк»…

16 хв. ago

ЄІБ планує надати 120 млн євро на модернізацію українських пунктів пропуску

Європейський інвестиційний банк (ЄІБ) розглядає можливість надання кредиту в розмірі близько 120 мільйонів євро Агентству…

20 хв. ago

«єЯсла» з’являться в «Дії» вже цього літа: допомогу можна буде оформити онлайн

Батьки дітей віком від одного до трьох років зможуть оформити державну допомогу «єЯсла» через застосунок…

41 хв. ago

Рятвальники загасили пожежу на інфраструктурному об’єкті на Київщині після атаки дронів РФ

Рятувальники ліквідували масштабну пожежу на об’єкті інфраструктури в Бориспільському районі Київської області, яка виникла 4…

57 хв. ago

Шевченківський суд Києва закрив справу проти детектива НАБУ Гусарова

Шевченківський районний суд міста Києва звільнив від кримінальної відповідальності детектива Національного антикорупційного бюро України Віктора…

1 годину ago

Київ передав військовим понад 1,6 тисячі дронів для фронту

Чергову партію безпілотників отримали військовослужбовці 12-го армійського корпусу Сухопутних військ ЗСУ.

2 години ago