SEOFAQ Telegram, маркетинг и SEO Канал SEOFAQT в мессенджере Telegram

Все чатыКейс: потеря краулингового бюджета по невнимательности


Кейс: потеря краулингового бюджета по невнимательности

#кейс_из_жизни #robots_txt @productseo

Решил этот кейс выделить в отдельный пост, поскольку встречаю слишком часто и уже даже не могу посчитать сколько было потрачено ресурсов поисковых роботов.

SEO’шники почему-то забывают правило, что Disallow:/url - это запрет на сканирование по началу URL. Если переписать в виде regex, то выйдет:

Disallow:^/url*$, где ^ - начало строки (после domain .com).

Если у вас, например, несколько языковых версий и нужно закрыть function.php, то нужно писать или Disallow:/*function.php (или аналогичный вариант, который зависит от того как этот файл используется) или же Disallow:/uk/function.php, Disallow:/en/function.php и так далее.

Аналогично и с get параметрами, которые могут быть в списке. Вы пишите Disallow:?sort=, но не закрываете url вида /url?size=12&sort=desc, который можно закрыть, например, через Disallow:*?*sort= . Почему со знаком вопроса? Что бы не закрыть случайно ЧПУ URL. Если уверены в себе, то можно и Disallow:*sort=

После Disallow: URL НАЧИНАЕТСЯ с данной маски, а не СОДЕРЖИТ, а потому не забываем о звездочках.

Источник новости https://t.me/productseo/11...