Непослушные нейросети и ленивые мошенники

BOOX · Вчера в 12:19

Одна из популярных тем недавних исследований, связанных со все большей доступностью мощных больших языковых моделей (LLM), — capability uplift (рост возможностей).

Это процесс, при котором человек с ограниченным опытом или ресурсами в какой-либо сфере благодаря LLM становится способен выполнять те или иные действия на гораздо более высоком уровне. Особенно это важно в сфере кибербезопасности, где возможность дешевле, быстрее и масштабнее проводить кибератаки может стать головной болью для тех, кто кибербезопасность обеспечивает.

Среди прочего злоумышленники используют LLM, чтобы генерировать контент для мошеннических веб-сайтов. Такие сайты могут имитировать ресурсы известных организаций, от соцсетей до банков, чтобы склонить пользователя ввести учетные данные (классический фишинг), а могут изображать магазины известных брендов с невероятными скидками на товары (доставки которых пользователь, конечно же, не дождется).

С помощью LLM злоумышленники способны полностью автоматизировать создание сразу десятков, а то и сотен веб-страниц с разным контентом. Если раньше при создании вредоносных страниц можно было автоматически выполнять только техническую работу: генерировать и регистрировать доменные имена, получать сертификаты и делать веб-страницы доступными через разного рода бесплатные хостинги, — то благодаря LLM эти страницы можно наполнять уникальным контентом достаточно высокого качества (куда выше, чем при использовании, например, синонимайзеров) без необходимости прибегать к дорогому ручному труду.

Это, в частности, затрудняет детектирование с помощью правил, основанных на использовании конкретных фраз. Для обнаружения сгенерированных с помощью LLM страниц нужны системы, анализирующие метаданные или структуру страницы, либо нечеткие подходы, например, на базе машинного обучения.

Но LLM не всегда работают идеально, а потому при большом масштабе автоматизации или слишком низком уровне контроля они могут оставлять артефакты, свидетельствующие о неумелом применении модели. Эти специфические фразы, которые с недавних пор начали появляться везде, от