Google опубликовал новое исследование о том, как они используют...
Google опубликовал новое исследование о том, как они используют S-BERT + S-CTS в качестве «высокоточной защиты» от массового контента, созданного ИИ / Chris Long
Это была интересная статья, которой поделился Гленн Гейб в начале месяца. В ней фактически раскрывается, как системы Google могут работать над выявлением контента, созданного ИИ, в больших масштабах. Команда Google по борьбе со спамом явно усердно работала над разработкой подобного продукта для борьбы с контентом, созданным ИИ.
S-CTS (Scalable Cluster Termination System) — это общая система, которая может обнаруживать спам на уровне кластера. S-CTS может видеть, работают ли несколько учетных записей / ресурсов вместе, создавая скоординированную сеть массового производства контента, созданного ИИ.
S-BERT — это пример метода, который может поддерживать классификацию контента. Вы, возможно, помните это как часть обновлений BERT давным-давно. Как Google может обнаруживать спам на уровне предложений? По сути, S-BERT может использовать эмбеддинги, чтобы определить, является ли «отпечаток» контента результатом работы ИИ. Если система вычисляет, что разные фрагменты текста имеют высокую степень сходства с ИИ, это может привести к включению в более широкую систему S-CTS.
Вероятно, это объясняет многое из того, что мы наблюдаем, особенно после обновлений от 20 января этого года. Google продолжает совершенствовать свои системы для контента, созданного ИИ, и улучшает способы обнаружения ИИ-контента.
Полный текст статьи: https://storage.googleapis.com/gweb-research2023-media/pubtools/1039291.pdf
Источник новости https://t.me/siteanalyzer/521...
7 
