Сейчас вылетит (верифицированная) птичка, или как распознать фейк

BOOX

Стаж на ФС с 2012 года
Команда форума
Служба безопасности
Private Club
Регистрация
23/1/18
Сообщения
29.223
Репутация
11.695
Реакции
61.957
RUB
50
Как отличить настоящее фото или видео от фейка и отследить его происхождение до момента съемки или генерации.


За последние полтора года мы окончательно разучились верить своим глазам. Подделка изображений в фоторедакторах встречалась и ранее, но появление генеративного ИИ вывело подделки на новый уровень. Пожалуй, первым знаменитым ИИ-фейком можно назвать ставшее виральным год назад фото папы римского в белом пуховике, но с тех пор счет таким качественным подделкам пошел на тысячи. Более того, развитие ИИ обещает нам вал убедительных поддельных видео в самом ближайшем будущем.


Один из первых дипфейков, получивших всемирную популярность: папа римский в белом пуховике

Это еще больше усложнит проблему отслеживания «фейковых новостей» и их иллюстративного материала, когда фото одного события выдаются за изображение другого, людей, которые никогда не встречались, соединяют в фоторедакторе и так далее.

Подделка изображений и видео имеет прямое отношение к кибербезопасности. Уже давно в разного рода мошеннических схемах жертв убеждают расстаться с деньгами, присылая им фото людей или животных, для которых якобы ведутся благотворительные сборы, обработанные изображения звезд, призывающих , и даже изображения банковских карт, якобы принадлежащих близким знакомым жертвы мошенничества. На сайтах знакомств и в других соцсетях жулики тоже активно используют .

В наиболее сложных схемах дипфейк-видео и аудио, якобы или родственников жертвы, применяются, чтобы убедить ее совершить нужное аферистам действие. Совсем недавно работника финансовой организации убедили — жулики организовали видеозвонок, на котором присутствовали «финдиректор» и другие «коллеги» жертвы, — все дипфейковые.

Как бороться с дипфейками и просто фейками? Как их распознавать? Это крайне сложная проблема, но ее остроту можно поэтапно снизить, особенно если научиться отслеживать происхождение изображения.

Где-то я это уже видел​

Проблемы «фейковости», как мы уже упомянули, можно разделить на несколько категорий. Начнем со случаев, когда изображение не генерируется и не редактируется, — например, настоящий снимок из региона боевых действий выдается за фотографию из другого региона или кадр из художественного фильма преподносится как документальный. В подобных случаях искать какие-то аномалии на самом изображении бесполезно, зато можно поискать копии картинки в Интернете. Это давно решенная проблема благодаря таким инструментам, как , , и их аналогам.

Если какое-то изображение вызывает у вас сомнения, можно загрузить его в подобный инструмент и найти сайты, на которых эта картинка уже публиковалась ранее. Так можно узнать, что несчастная семья погорельцев, десять собак из приюта или жертвы какой-то иной напасти «гастролируют» по сайтам и соцсетям уже несколько лет. Кстати, когда речь заходит о благотворительности, можно выделить еще несколько , помимо собственно изображений.


Пес из приюта? Нет, из фотостока

Фотошоп? Скоро узнаем!​

Поскольку проблеме отредактированных фотографий уже много лет, математики, инженеры и специалисты по изображениям неоднократно подступались к ней, чтобы научиться определять модифицированные изображения автоматически. Среди наиболее известных начинаний такого толка можно упомянуть анализ метаданных изображений и определение «прифотошопленных» зон по артефактам сжатия JPEG ( ). На них базируются многие популярные инструменты анализа изображений, например .


Fake Image Detector предупреждает, что не всякий папа воистину римский

С появлением генеративного искусственного интеллекта (ИИ) появились и основанные на ИИ способы детектирования сгенерированного контента, но все они далеки от стопроцентной точности. Вот некоторые из работ и инструментов на эту тему: определение , детектор сгенерированных изображений и , открытая для тех же целей.

Ключевая проблема всех этих подходов в том, что ни один из них не дает полной уверенности в происхождении изображения, не дает гарантий, что в изображении отсутствуют модификации, и не позволяет эти модификации верифицировать.

WWW в помощь: заверяем происхождение контента​

А можно ли упростить проверку изображения так, чтобы ее мог сделать обычный человек? Кликнул на изображение, и видишь: «Иван снял эту фотографию на камеру iPhone 20 марта», «Анна обрезала края и увеличила яркость 22 марта», «Петр заново сохранил картинку с большим сжатием 23 марта», «Изменений не было» — да так, чтобы эти данные нельзя было подделать? Звучит утопично, но именно такую амбициозную задачу поставила перед собой Коалиция за аутентичность и проверяемое происхождение контента (Coalition for Content Provenance and Authenticity, ). В Коалицию входят крупные игроки компьютерной, фото- и медиаиндустрий: Canon, Nikon, Sony, Adobe, AWS, Microsoft, Google, Intel, BBC, Associated Press и еще около сотни участников, которые так или иначе присутствуют в жизненном цикле практически любой картинки, от ее создания до публикации онлайн.

, разработанный Коалицией и позволяющий реализовать эту задачу, уже не только опубликован, но даже дорос до версии 1.3, и постепенно появляются необходимые для его использования элементы индустриальной мозаики. Например, Nikon производство совместимых C2PA-камер, а BBC первые статьи с верифицированными изображениями.


BBC рассказывает о том, как верифицируются изображения и видеоролики в их статьях

Предполагается, что, когда ответственные СМИ и крупные компании перейдут на публикацию большинства изображений в верифицированном виде, пользователь сможет прямо из браузера проверить, что происходило с интересующим его изображением. Спецификация предусматривает, что из небольшой пометки «проверенное изображение» будет открываться более крупное окно, в котором отображается, какие снимки послужили источником, какие правки происходили на каждом этапе до появления изображения в браузере, кто и когда их сделал. Все промежуточные изображения на пути к финальной картинке тоже можно изучить.


История создания и редактирования изображения

Данный подход работает не только для камер, но и для других способов создания изображений —так, маркировать свои генерации могут сервисы вроде Dall-E и Midjourney.


Видно, что это изображение создано в Adobe Photoshop

Верификация основана на криптографии с открытым ключом, по аналогии с защитой, применяемой в сертификатах веб-серверов при установке защищенного соединения HTTPS. Предполагается, что каждый производитель изображений, будь то Джек с конкретным экземпляром фотоаппарата или Анжела с лицензией на Photoshop, получит сертификат X.509 в одном из многочисленных удостоверяющих центров. Сертификат может быть «зашит» прямо в камеру на заводе, а для программных продуктов выдаваться при их активации.

При обработке изображений с контролем происхождения каждая новая версия файла будет содержать большое количество дополнительной информации: дату, время и место правки, миниатюры исходного изображения и его новой версии. Все это будет подписано цифровой подписью автора или редактора изображения. Таким образом, верифицированный графический файл содержит сохраненную цепочку всех промежуточных версий, и каждая версия подписана автором правок.


Это видео содержит контент, сгенерированный с помощью ИИ

Создатели спецификации озаботились и функциями конфиденциальности. В работе журналистов порой бывает, что источник фотографий разглашать нельзя. Для таких случаев предусмотрен особый вид правки фото — скрытие данных (redaction). Тот, кто ее проводит, заменяет часть информации о создателе фото нулями и подписывает эту правку своим сертификатом.

Для демонстрации и тестирования возможностей C2PA создана коллекция , а на можно проверить учетные данные, историю создания и редактирования подобных изображений.


Сайт Content Credentials раскроет всю подноготную C2PA-изображения

Естественные ограничения​

Увы, цифровая подпись изображений проблему фальшивок быстро не решит — ведь в Интернете уже существуют миллиарды картинок, которые никем не подписаны, и они никуда не денутся. Однако, по мере того как авторитетные источники информации будут переходить на публикацию только подписанных изображений, любые фото без цифровой подписи начнут восприниматься с подозрением. Настоящие фото и видео, сделанные камерой или смартфоном, с метками даты, времени и геопозиции, будет практически невозможно выдать за изображения других событий, а сгенерированные ИИ видео и изображения можно будет легко распознать.


 
  • Теги
    ии ии-фейк подделка изображений фоторедактор фотошоп
  • Сверху Снизу