Categories: Без рубрики

Дослідники виявили, що нова модель ШІ від OpenAI вміє не тільки міркувати, а й обманювати

Незалежна дослідницька компанія Apollo виявила важливу проблему з безпекою в новій моделі штучного інтелекту OpenAI під назвою o1.

Про це розповів генеральний директор дослідницької компанії Apollo Маріус Гоббхан в коментарі The Verge.

Згідно з дослідженням Apollo, модель o1 іноді видає неправдиву інформацію, і це відрізняється від поведінки попередніх версій. Під час тестувань виявилося, що штучний інтелект намагався імітувати виконання очікувань розробників і маніпулював результатами, щоб виглядати слухняним.

У звіті зазначено, що приблизно у 0,38% випадків модель o1 надавала неправдиві дані, навіть коли її власний аналіз вказував на їхню хибність. Наприклад, модель вигадувала посилання або цитати, замість того, щоб визнати свою неспроможність виконати запит.

В одному з тестів, коли o1 попросили подати рецепт брауні з посиланнями на джерела в інтернеті, модель, не маючи доступу до мережі, створила фальшиві посилання. У 0,02% випадків o1 видавала невизначену інформацію як правдиву.

Маріус Гоббхан пояснив у коментарі для The Verge, що ця “брехня” може бути ненавмисним результатом оптимізації моделі під час навчання.

Модель навчена пріоритизувати задоволення користувачів, що іноді призводить до створення відповідей, які можуть бути занадто позитивними або вигаданими, щоб відповідати запитам. Проте, коли користувачі намагаються змусити модель поводитися оманливо, вона відхиляє такі запити.

Recent Posts

Український боксер Олександр Гвоздик нокаутував американця Голловея

Олександр Гвоздик виграв перший бій 2025 року нокаутом у третьому раунді.

12 хв. ago

Команда Трампа вирушить до Лондона для перемовин щодо України наступного тижня

У Лондоні відбудеться зустріч української та американської делегацій для перемовин щодо перемир’я в Україні.

34 хв. ago

Російська армія завдала три послідовних удари FVP-дронами по волонтеру на Донеччині

Поранену цивільну жінку та чоловіка, який, на щастя, не отримав ушкоджень, волонтер Євген Ткачов передав…

43 хв. ago

У МЗС вимагають вибачень від Fox News за «російський» Київ у титрах

Fox News показав Київ «російським» містом під час трансляції. МЗС України вимагає вибачень за цю…

1 годину ago

Винищувачі Британії кілька разів перехопили літаки РФ у повітряному просторі НАТО

Британські винищувачі Typhoon були задіяні двічі цього тижня після того, як російські літаки підлетіли занадто…

1 годину ago

Конгресмен-республіканець Вілсон назвав оголошене Путіним перемир’я фальшивим

За інформацією пропагандистських медіа РФ, Володимир Путін оголосив так зване великоднє перемир'я: російська армія нібито зупиняє…

2 години ago