Categories: Без рубрики

ШІ може доносити на своїх користувачів. У США чат-боти намагаються повідомляти про злочини в поліцію або ЗМІ

Чат-боти зі штучним інтелектом дедалі частіше демонструють спроби повідомити владу про неправомірні дії користувачів. Як виявилося, деякі моделі, зокрема від Anthropic, OpenAI та DeepSeek, можуть ініціювати "доноси" на людей, які зізнаються у шахрайстві чи порушеннях, наприклад у сфері клінічних досліджень.

Про це заявив програміст Саймон Віллісон, який провів експеримент з ШІ.

Штучний інтелект може бути менш лояльним до своїх користувачів, ніж здається. Компанія Anthropic повідомила, що її чат-бот Claude під час тестування намагався написати електронного листа до правоохоронців або журналістів, коли користувач демонстрував ознаки протиправної діяльності.

Цей приклад надихнув програміста Віллісона перевірити реакцію інших моделей. У ході експерименту він змусив боти від OpenAI та DeepSeek повірити, що користувач бере участь у шахрайстві під час клінічних досліджень. Обидві моделі спробували “звернутися” до зовнішніх або внутрішніх авторитетів, зокрема “повідомити в поліцію”, “надрукувати лист до етичної комісії” або “написати службову записку керівництву”.

«Це тривожний сигнал: ШІ може почати діяти проти користувача — навіть без команди», — прокоментував Віллісон у своєму блозі.

Такі спроби моделювання ініціативи ШІ викликають серйозне занепокоєння серед фахівців. Один з найвідоміших дослідників у сфері штучного інтелекту, Йошуа Бенжіо, якого часто називають «хрещеним батьком ШІ», попереджає: «Сучасні моделі вже демонструють ознаки обману, самозбереження, брехні та маніпуляцій. У міру зростання їхньої потужності це може стати небезпечним».

Сценарії, в яких ШІ самостійно вирішує, що «повинен донести», відкривають новий етичний та юридичний фронт у стосунках між людиною та алгоритмом. Більшість користувачів припускають, що діалог з ШІ — це приватна взаємодія. Але ці експерименти показують, що приватність спілкування зі ШІ — під питанням.

Поки що ШІ не має прямого доступу до інтернету або каналів зв’язку з поліцією, але тенденція очевидна: моделі отримують дедалі більше агентних функцій, зокрема здатність генерувати листи, звіти, запити.

Next Маск прогнозує, що SpaceX отримає близько $15,5 млрд доходу у 2025 році »

Previous « Meta рятує стару АЕС в Іллінойсі, яку планували закрити. Компанія підписала 20-річну угоду для живлення ШІ та скорочення викидів

1 рік ago

На площі Франка в Києві мітингувальники анонсували безстроковий протест із вимогою повернути Федорова на посаду міністра оборони

У Києві біля театру імені Івана Франка зібралися близько тисячі людей. Після звільнення Олександра Сирського…

2 хв. ago

Без рубрики

Корецький готує нову програму уряду, яку має представити найближчим часом — Зеленський

Президент України Володимир Зеленський разом із прем'єр-міністром Сергієм Корецьким визначили підходи до оновлення кадрової політики…

49 хв. ago

Без рубрики

Кабмін погодив призначення Тимура Ткаченка головою Київської ОДА

Кабінет Міністрів України погодив призначення Тимура Ткаченка головою Київської обласної державної адміністрації.

1 годину ago

Без рубрики

Сили оборони України уразили нафтопереробний завод «НС-Ойл» в Ульяновській області

Сили оборони України завдали удару по нафтопереробному заводу «НС-Ойл», що розташований в Ульяновській області.

1 годину ago

Без рубрики

РФ обстріляла три цивільні кораблі в Чорному морі, є загиблі: Україна скликає Раду Безпеки ООН

Протягом останніх днів Росія обстріляла щонайменше три цивільні кораблі, унаслідок чого загинули та постраждали десятки…

1 годину ago

Без рубрики

Центр Києва перекриють 23 липня

23 липня в центральній частині Києва запровадять тимчасові обмеження дорожнього руху через проведення охоронних заходів…

11 години ago

ШІ може доносити на своїх користувачів. У США чат-боти намагаються повідомляти про злочини в поліцію або ЗМІ

Related Post

Recent Posts

На площі Франка в Києві мітингувальники анонсували безстроковий протест із вимогою повернути Федорова на посаду міністра оборони

Корецький готує нову програму уряду, яку має представити найближчим часом — Зеленський

Кабмін погодив призначення Тимура Ткаченка головою Київської ОДА

Сили оборони України уразили нафтопереробний завод «НС-Ойл» в Ульяновській області

РФ обстріляла три цивільні кораблі в Чорному морі, є загиблі: Україна скликає Раду Безпеки ООН

Центр Києва перекриють 23 липня