Categories: Без рубрики

Дослідники виявили, що нова модель ШІ від OpenAI вміє не тільки міркувати, а й обманювати

Незалежна дослідницька компанія Apollo виявила важливу проблему з безпекою в новій моделі штучного інтелекту OpenAI під назвою o1.

Internet technology and people's networks use AI to help with work, AI Learning or artificial intelligence in business and modern technology, AI technology in everyday life.

Про це розповів генеральний директор дослідницької компанії Apollo Маріус Гоббхан в коментарі The Verge.

Згідно з дослідженням Apollo, модель o1 іноді видає неправдиву інформацію, і це відрізняється від поведінки попередніх версій. Під час тестувань виявилося, що штучний інтелект намагався імітувати виконання очікувань розробників і маніпулював результатами, щоб виглядати слухняним.

У звіті зазначено, що приблизно у 0,38% випадків модель o1 надавала неправдиві дані, навіть коли її власний аналіз вказував на їхню хибність. Наприклад, модель вигадувала посилання або цитати, замість того, щоб визнати свою неспроможність виконати запит.

В одному з тестів, коли o1 попросили подати рецепт брауні з посиланнями на джерела в інтернеті, модель, не маючи доступу до мережі, створила фальшиві посилання. У 0,02% випадків o1 видавала невизначену інформацію як правдиву.

Маріус Гоббхан пояснив у коментарі для The Verge, що ця “брехня” може бути ненавмисним результатом оптимізації моделі під час навчання.

Модель навчена пріоритизувати задоволення користувачів, що іноді призводить до створення відповідей, які можуть бути занадто позитивними або вигаданими, щоб відповідати запитам. Проте, коли користувачі намагаються змусити модель поводитися оманливо, вона відхиляє такі запити.

Next Вбивство на АЗС у Києві: ексслідчий зазначив, що загиблий міг знати нападника »

Previous « Продаж квитків на популярний поїзд Варшава — Львів відновлюють: УЗ оприлюднила розклад руху

Tags: СуспільствоТехнології

2 роки ago

В Одесі вулицю Ільфа і Петрова перейменували на честь родини Глодан, яка загинула внаслідок російської агресії

В Одесі вулицю Ільфа і Петрова перейменували на честь родини Глодан, члени якої загинули через…

15 хв. ago

Без рубрики

У Грузії суд звільнив під заставу чоловіка, затриманого після конфлікту з російськими туристками

У Грузії суддя встановила заставу у розмірі 5000 ларі (майже 2 тисячі доларів) для Георгія…

37 хв. ago

Без рубрики

НАБУ і САП завершили розслідування розкрадання понад 241 мільйона гривень на закупівлі обладнання для Національного інституту раку

Національне антикорупційне бюро та Спеціалізована антикорупційна прокуратура завершили досудове розслідування у справі злочинної організації, члени…

57 хв. ago

Без рубрики

Під час розмінування Харківщини загинули двоє вибухотехніків Нацполіції Максим Мовчан та Анатолій Радковський

Під час виконання службового завдання з розмінування деокупованої території Харківської області 20 липня 2026 року…

1 годину ago

Без рубрики

У Баку відбулася таємна зустріч експосадовців Німеччини та Росії щодо війни в Україні: Алієв розкрив деталі

Президент Азербайджану Ільхам Алієв заявив, що колишні високопосадовці Німеччини та Росії нещодавно зустрілися в Баку.…

1 годину ago

Без рубрики

В Ірпені видали ще 16 житлових ваучерів для переселенців із тимчасово окупованих територій

Комісія Ірпінської міської ради схвалила ще 16 житлових ваучерів для внутрішньо переміщених осіб, які виїхали…

2 години ago