SEOFAQ Telegram, маркетинг и SEO Канал SEOFAQT в мессенджере Telegram

Все чатыАтаки на канонические ссылки Эти атаки не направлены на...

 291  


Атаки на канонические ссылки

Эти атаки не направлены на немедленное нанесение катастрофического ущерба, их цель - истощение ресурсов, усложнение анализа и загрязнение данных жертвы.

Их суть - заставить ботов поисковых систем запрашивать, краулить и индексировать множество URL-адресов, которые не должны быть доступны или проиндексированы.

Последствия таких атак могут быть значительными.

Поисковики могут тратить больше времени на дубликаты страниц, а не на новый контент, что приводит к неэффективному краулингу.

Вы можете столкнуться с необходимостью разбираться с избыточным количеством данных в GSC, а сайты могут испытывать неожиданные колебания в выдаче, которые влияют на трафик и эффективность бизнеса.

В основе атак на канонические ссылки лежит эксплуатация неправильной канонизации.

Сайты без надежной канонической обработки особенно уязвимы, поскольку злоумышленники могут генерировать множество вариантов URI для одной страницы.

Например, одна страница может быть доступна через 16 различных URL, учитывая вариации протокола (http/https), субдомена (www или нет), капитализации и параметров запроса.

http://www.example.com/somepage

https://www.example.com/somepage

http://example.com/somepage

https://example.com/somepage

...

https://example.com/SomePage?parameter=value

Ситуация может быть еще более усложнена использованием параметров и значений в строках запросов:

/somepage?param1=aaa

/somepage?param2=bbb

/somepage?param1=aaa

/somepage?param1=aaa&param2=bb

/somepage?Param1=aa&Param2=bb

...

Такое увеличение количества УРЛов может привести к нескольким проблемам, причем их влияние усиливается из-за вариаций строк запросов:

1. Размывание ссылок, когда входящие ссылки распределяются по разным URI.

2. Потенциальное ранжирование слабых страниц в Google

3. Чрезмерный краулинг и индексация вариантов URI.

Третий пункт может быть особенно проблематичным.

Сайт с 500 страницами может внезапно показаться имеющим 8,000 или более страниц, если учесть вариации протоколов и поддоменов.

Если учесть перестановки строк запросов, то это число может вырасти до 16,000 или даже выше, перегружая Googlebot и потенциально влияя на наполнение и индексацию важного нового контента.

Ситуация может еще больше усугубиться из-за использования параметров и значений в строках запросов, что может привести к увеличению числа воспринимаемых страниц до десятков тысяч.

Кроме того, проблему могут усугубить бесконечные пространства для краулинга, создаваемые системами поиска и пагинации сайтов: боты могут увидеть "ссылки" на несуществующие страницы и добавить их в очередь на сканирование.

Чтобы защититься от атак на канонические ссылки, нужно сосредоточиться на правильной канонизации.

Хотя невозможно помешать злоумышленникам создавать странные ссылки или направлять поисковых ботов на карты сайта, полные нерелевантных УРЛов, надежная канонизация может значительно смягчить последствия таких атак.

Реализовать каноникализацию можно различными способами:

1. Использование элемента канонической ссылки в <head> страницы

2. Реализация ответа канонической ссылки в HTTP заголовке

3. Установка канонических ссылок с помощью сайтмапов

Более подробно об этом писалось тут.

Для более агрессивной защиты можно использовать "жесткие" методы каноникализации, такие как редиректы и отклонение определенных типов запросов, хотя эти подходы встречаются реже.

https://nseo.arclite.solutions/canonical-link-attack

@MikeBlazerX

Ссылки из поста:
https://t.me/MikeBlazerX/3721
https://t.me/MikeBlazerX

Источник новости https://t.me/mikeblazerx/3788...