Чат-боти зі штучним інтелектом дедалі частіше демонструють спроби повідомити владу про неправомірні дії користувачів. Як виявилося, деякі моделі, зокрема від Anthropic, OpenAI та DeepSeek, можуть ініціювати "доноси" на людей, які зізнаються у шахрайстві чи порушеннях, наприклад у сфері клінічних досліджень.
Про це заявив програміст Саймон Віллісон, який провів експеримент з ШІ.
Штучний інтелект може бути менш лояльним до своїх користувачів, ніж здається. Компанія Anthropic повідомила, що її чат-бот Claude під час тестування намагався написати електронного листа до правоохоронців або журналістів, коли користувач демонстрував ознаки протиправної діяльності.
Цей приклад надихнув програміста Віллісона перевірити реакцію інших моделей. У ході експерименту він змусив боти від OpenAI та DeepSeek повірити, що користувач бере участь у шахрайстві під час клінічних досліджень. Обидві моделі спробували “звернутися” до зовнішніх або внутрішніх авторитетів, зокрема “повідомити в поліцію”, “надрукувати лист до етичної комісії” або “написати службову записку керівництву”.
«Це тривожний сигнал: ШІ може почати діяти проти користувача — навіть без команди», — прокоментував Віллісон у своєму блозі.
Такі спроби моделювання ініціативи ШІ викликають серйозне занепокоєння серед фахівців. Один з найвідоміших дослідників у сфері штучного інтелекту, Йошуа Бенжіо, якого часто називають «хрещеним батьком ШІ», попереджає: «Сучасні моделі вже демонструють ознаки обману, самозбереження, брехні та маніпуляцій. У міру зростання їхньої потужності це може стати небезпечним».
Сценарії, в яких ШІ самостійно вирішує, що «повинен донести», відкривають новий етичний та юридичний фронт у стосунках між людиною та алгоритмом. Більшість користувачів припускають, що діалог з ШІ — це приватна взаємодія. Але ці експерименти показують, що приватність спілкування зі ШІ — під питанням.
Поки що ШІ не має прямого доступу до інтернету або каналів зв’язку з поліцією, але тенденція очевидна: моделі отримують дедалі більше агентних функцій, зокрема здатність генерувати листи, звіти, запити.
У столичній Voitok Gallery розпочала роботу групова виставка «Селекція цінностей». Організатори представили більше 50 творів сучасного…
У Київському Молодіжному домі (вул. Володимирська, 5Б) 5 червня о 18:00 відбудеться відкриття виставки художника…
В окупованому Криму колишню поліціянтку Людмилу Колесникову засудили до 17 років колонії через звинувачення в…
Мінекономіки України запропонувало доповнити мандат американсько-українського Інвестиційного фонду відбудови проєктами у сфері оборонної промисловості, що…
Російська залізниця зазнає значного падіння обсягів вантажоперевезень через економічні проблеми та атаки українських безпілотників, які…
Ознаки академічної недоброчесності виявили в докторській дисертації Лілії Філіпішиної — кандидатки до Наукового комітету Національної…