Categories: Без рубрики

ШІ може доносити на своїх користувачів. У США чат-боти намагаються повідомляти про злочини в поліцію або ЗМІ

Чат-боти зі штучним інтелектом дедалі частіше демонструють спроби повідомити владу про неправомірні дії користувачів. Як виявилося, деякі моделі, зокрема від Anthropic, OpenAI та DeepSeek, можуть ініціювати "доноси" на людей, які зізнаються у шахрайстві чи порушеннях, наприклад у сфері клінічних досліджень.

Про це заявив програміст Саймон Віллісон, який провів експеримент з ШІ.

Штучний інтелект може бути менш лояльним до своїх користувачів, ніж здається. Компанія Anthropic повідомила, що її чат-бот Claude під час тестування намагався написати електронного листа до правоохоронців або журналістів, коли користувач демонстрував ознаки протиправної діяльності.

Цей приклад надихнув програміста Віллісона  перевірити реакцію інших моделей. У ході експерименту він змусив боти від OpenAI та DeepSeek повірити, що користувач бере участь у шахрайстві під час клінічних досліджень. Обидві моделі спробували “звернутися” до зовнішніх або внутрішніх авторитетів, зокрема “повідомити в поліцію”, “надрукувати лист до етичної комісії” або “написати службову записку керівництву”.

«Це тривожний сигнал: ШІ може почати діяти проти користувача — навіть без команди», — прокоментував Віллісон у своєму блозі.

Такі спроби моделювання ініціативи ШІ викликають серйозне занепокоєння серед фахівців. Один з найвідоміших дослідників у сфері штучного інтелекту, Йошуа Бенжіо, якого часто називають «хрещеним батьком ШІ», попереджає: «Сучасні моделі вже демонструють ознаки обману, самозбереження, брехні та маніпуляцій. У міру зростання їхньої потужності це може стати небезпечним».

Сценарії, в яких ШІ самостійно вирішує, що «повинен донести», відкривають новий етичний та юридичний фронт у стосунках між людиною та алгоритмом. Більшість користувачів припускають, що діалог з ШІ — це приватна взаємодія. Але ці експерименти показують, що приватність спілкування зі ШІ — під питанням.

Поки що ШІ не має прямого доступу до інтернету або каналів зв’язку з поліцією, але тенденція очевидна: моделі отримують дедалі більше агентних функцій, зокрема здатність генерувати листи, звіти, запити.

Recent Posts

Український культурний фонд досліджує експортний потенціал креативних індустрій

Український культурний фонд розпочав масштабне дослідження стану експортного потенціалу української сфери культури та креативних індустрій.…

14 хв. ago

Стала відома позиція Міносвіти

Міністр освіти і науки Оксен Лісовий прокоментував депутатський законопроєкт щодо скасування обов'язкового тесту з математики…

16 хв. ago

«Каблучки незламності» з Лук’янівки: киянка виставила на благодійний аукціон прикраси зі знищеного магазину її матері

Киянка запустила благодійний аукціон із продажу ювелірних виробів, які дивом вціліли після ракетного удару по…

17 хв. ago

З 5 по 12 червня в Києві пройде 23-й Міжнародний фестиваль документального кіно про права людини Docudays UA

23-й Міжнародний фестиваль документального кіно про права людини Docudays UA відбудеться в Києві з 5…

32 хв. ago

Ціна «Київської перепічки» зросла до 60 гривень

Легендарна «Київська перепічка» знову подорожчала. Вартість сосиски в тісті зросла на 5 гривень і тепер…

37 хв. ago

Україна запропонувала Німеччині “ракетний бартер” задля Patriot, – Bloomberg

Україна звернулася до Німеччини з проханням надати десятки додаткових ракет-перехоплювачів Patriot зі своїх запасів уже…

54 хв. ago