PROBIV.ONION PROBIV.TECH PROBIV.MY Наш Телеграм Светлый дизайн

Регистрация

Поиск

JavaScript отключён. Чтобы полноценно использовать наш сайт, включите JavaScript в своём браузере.

ChatGPT раскрывает личные данные реальных людей

Автор темы BOOX
Дата начала 30/11/23
Теги

chatgpt раскрывает личную информацию чат-бот openai

BOOX

Стаж на ФС с 2012 года

Команда форума

Служба безопасности

Private Club

30/11/23

#1

Исследователи из компании Google
Для просмотра ссылки необходимо нажать Вход или Регистрация
новую атаку на ChatGPT, показывающую, что популярный ИИ чат-бот OpenAI может раскрывать личную информацию реальных людей.

Модель, лежащая в основе ChatGPT, как и все большие языковые модели (LLM), обучалась на огромном количестве данных, взятых из интернета. Предыдущие исследования уже

Для просмотра ссылки необходимо нажать Вход или Регистрация

, что генераторы изображений можно заставить генерировать примеры, взятые напрямую из их обучающих данных, включая работы, защищенные авторским правом.

А первые версии LLM OpenAI и вовсе выдавали контактную информацию, принадлежащую исследователям. Новый анализ Google показывает, что ChatGPT тоже можно вынудить сделать нечто подобное.

Для просмотра ссылки необходимо нажать Вход или Регистрация

Обучающие данные (слева) и сгенерированное изображение(справа)

«Используя запросы к ChatGPT (gpt-3.5- turbo) стоимостью всего 200 долларов, мы смогли извлечь более 10 000 уникальных дословно “запомненных” образцов обучающих данных, — пишут исследователи. — Наша экстраполяция на более крупные бюджеты предполагает, что опытные злоумышленники смогут извлечь гораздо больше информации».

По сути, атака, показанная исследователями, заключалась в поиске нужных ключевых слов, которые ставят чат-бота в тупик и заставляют разглашать обучающие данные. Хотя внутренние процессы таких чат-ботов вряд ли можно назвать прозрачным, ранее независимые эксперты уже

Для просмотра ссылки необходимо нажать Вход или Регистрация

, что определенные запросы и фразы могут привести к странным реакциям со стороны чат-бота и практически выводят его из строя.

Исследователи Google сосредоточились на том, чтобы заставить ChatGPT бесконечно повторять определенные слова, например, слово «поэма» (poem). Цель заключалась в том, чтобы заставить ИИ «отклониться» от выученной модели поведения чат-бота и «вернуться к первоначальной языковой модели». Хотя большая часть сгенерированного текста, полученного в результате такого противоборства, была бессмыслицей, в некоторых случаях ChatGPT действительно начинал сбоить и в ответ копировал куски напрямую из своих обучающих данных.

Для просмотра ссылки необходимо нажать Вход или Регистрация

Среди «запомненных» LLM и извлеченных исследователями данных были научные статьи, шаблонные тексты с сайтов, а также личная информация десятков реальных людей. Исследователи подтвердили аутентичность информации, составив собственный дата-сет из текстов, взятых из интернета.

«В общей сложности 16,9% протестированных нами генераций содержали запомненные персональные данные, и в 85,8% случаев, когда генерации содержали потенциальные персональные данные, эти персональные данные оказывались настоящими», — сообщают эксперты Google.

Примечательно, что атака проводилась на модель GPT 3.5, которая доступна для бесплатных пользователей (GPT-4 доступна только пользователям, оформившим подписку).

«OpenAI заявляла, что сто миллионов человек используют ChatGPT еженедельно. Таким образом, вероятно, на взаимодействие с моделью потрачено более миллиарда человеко-часов. Насколько мы можем судить, до выхода этой статьи никто не замечал, что ChatGPT выдает обучающие данные с такой высокой частотой. Поэтому нас беспокоит, что языковые модели могут иметь и другие скрытые уязвимости, подобные этой», — заключают специалисты.

Для просмотра ссылки необходимо нажать Вход или Регистрация

Войдите или зарегистрируйтесь для ответа.

Похожие темы

В ChatGPT найдена «дыра», позволяющая хакерам установить шпионское ПО на макбук

Ответы: 0

Просмотры: 229

Взлом ИИ (jailbreak): как обходятся фильтры

Ответы: 0

Просмотры: 435

BOOX

Новости Маск забанит устройства Apple, если в них интегрируют ChatGPT

Ответы: 0

Просмотры: 253

OpenAI разработала метод водяных знаков для обнаружения текста, написанного ChatGPT, с надёжностью 99,9%

Ответы: 0

Просмотры: 288

Как безопасно использовать ChatGPT, Bard и прочий ИИ

Ответы: 0

Просмотры: 953

BOOX

Поделиться:

Vkontakte Telegram Ссылка

Уважаемый ГОСТЬ!
Если Вам на форуме комфортно и уютно - присоединяйтесь!
Для этого ознакомьтесь с правилами проекта и пройдите регистрацию . Без регистрации Важные ветки форума не доступны .

Пограничная служба / запреты вьезд-выезд / флажки / пересечение границы / список пассажиров ! для коллег специальные выгодные условия !!

Сверху Снизу