Социальные сети могут обязать блокировать дипфейки ещё до того, как их достоверность будет проверена у упомянутых лиц. Роскомнадзор предложил платформам самим выявлять подозрительный контент и останавливать его распространение, пока не поступит подтверждение от пострадавших. Однако у компаний пока нет надёжных алгоритмов для безошибочного распознавания всего ИИ-контента, а ошибочные блокировки чреваты конфликтами с авторами.
Стремительное распространение дипфейков создало репутационные риски для граждан и юрлиц. Существующий порядок, требующий проверки сведений у упомянутых лиц, часто оказывается слишком медленным – ложный образ успевает разойтись, пока готовится официальный ответ. Чтобы ускорить реакцию, Роскомнадзор предложил переложить бремя первичного фильтра на сами соцсети. Платформы должны будут на своё усмотрение маркировать или ограничивать показ материалов, похожих на дипфейки. В качестве дополнительных мер рассматриваются создание базы технологических угроз и обязательная маркировка синтезированных данных. Но представители отрасли предупреждают: современные нейросети быстро обходят существующие детекторы, а автоматические фильтры часто ошибаются, блокируя легальный контент. Наиболее вероятным вариантом считают гибридную модель – автоматический отсев явных фейков плюс ручная проверка спорных случаев.
На отраслевом форуме, посвящённом доверенному искусственному интеллекту, представитель Роскомнадзора – Главный радиочастотный центр – озвучил инициативу изменить правила борьбы с дипфейками. Предлагается обязать соцсети самостоятельно выявлять материалы, созданные или изменённые с помощью ИИ, и оперативно ограничивать их распространение, не дожидаясь обращений от лиц, упомянутых в таких видео или фото. Пока что законодательство требует сначала подтвердить недостоверность у героев контента, что занимает время. За этот период фейк может набрать миллионы просмотров.
Новый подход подразумевает, что платформы разработают собственные механизмы быстрого реагирования. В дополнение обсуждается маркировка синтезированных данных и формирование общего реестра технологических угроз, который поможет быстрее распознавать типовые схемы обмана. Однако технические эксперты сомневаются, что на сегодняшний день существует надёжный детектор, способный различать все виды ИИ-контента с приемлемой точностью. Генеративные модели постоянно совершенствуются, и многие из них специально обучают обходить существующие фильтры.
Из-за этого автоматические системы часто дают ложные срабатывания, блокируя записи реальных людей или произведения искусства. Такие ошибки могут вызвать недовольство пользователей и претензии со стороны брендов. Поэтому специалисты предлагают компромисс: автоматическая система будет отсеивать только явно подозрительные материалы, а самые сложные случаи должны отправляться на ручную проверку модераторами. Полностью автоматизировать процесс, вероятно, не удастся, но повысить эффективность реагирования можно уже сейчас, комбинируя алгоритмы и живых специалистов.






















