Categories: Без рубрики

Дослідники виявили, що нова модель ШІ від OpenAI вміє не тільки міркувати, а й обманювати

Незалежна дослідницька компанія Apollo виявила важливу проблему з безпекою в новій моделі штучного інтелекту OpenAI під назвою o1.

Про це розповів генеральний директор дослідницької компанії Apollo Маріус Гоббхан в коментарі The Verge.

Згідно з дослідженням Apollo, модель o1 іноді видає неправдиву інформацію, і це відрізняється від поведінки попередніх версій. Під час тестувань виявилося, що штучний інтелект намагався імітувати виконання очікувань розробників і маніпулював результатами, щоб виглядати слухняним.

У звіті зазначено, що приблизно у 0,38% випадків модель o1 надавала неправдиві дані, навіть коли її власний аналіз вказував на їхню хибність. Наприклад, модель вигадувала посилання або цитати, замість того, щоб визнати свою неспроможність виконати запит.

В одному з тестів, коли o1 попросили подати рецепт брауні з посиланнями на джерела в інтернеті, модель, не маючи доступу до мережі, створила фальшиві посилання. У 0,02% випадків o1 видавала невизначену інформацію як правдиву.

Маріус Гоббхан пояснив у коментарі для The Verge, що ця “брехня” може бути ненавмисним результатом оптимізації моделі під час навчання.

Модель навчена пріоритизувати задоволення користувачів, що іноді призводить до створення відповідей, які можуть бути занадто позитивними або вигаданими, щоб відповідати запитам. Проте, коли користувачі намагаються змусити модель поводитися оманливо, вона відхиляє такі запити.

Recent Posts

Росіяни знову атакували Харків

Війська РФ завдають авіаударів по Харкову.

1 годину ago

Сподіваюся, що Ілон повернеться до президента — Венс про сварку між Трампом та Маском

Віцепрезидент США Джей Ді Венс висловив надію, що Ілон Маск перестане атакувати президента Дональда Трампа у соцмережах…

2 години ago

США скасували ліцензії на експорт запчастин для АЕС у Китаї – Reuters

Американська влада скасувала для постачальників ядерного обладнання ліцензію на продаж запчастин для АЕС у Китаї.

2 години ago

У квартирі в Києві два роки жив дикий вовк. Волонтери забрали його до притулку

У київській квартирі жив вовк, якого власники хворим придбали через інтернет. За два роки вони вирішили віддати…

2 години ago

У Дніпрі підірвали авто прокурора, затримані двоє російських агентів

СБУ повідомляє, що разом з поліцією затримала двох агентів російських спецслужб, які напередодні, 6 червня, підірвали автомобіль…

3 години ago

Операція “Павутина”. СБУ показали нове відео атаки на Ту-22МЗ

Служба безпеки України показала нове відео зі спецоперації "Павутина". На ньому видно повний шлях одного з…

3 години ago