Кейс: Пагинация. Проверка Coverage -> Excluded
115
Кейс: Пагинация. Проверка Coverage -> Excluded
#кейс_из_жизни #pagination @productseo
Есть множество используемых SEO`шниками схем по реализации пагинации (с точки зрения seo тегов):
1. Canonical на первую;
2. Noindex, follow, canonical self reference;
3. Noindex, follow;
4. Noindex, nofollow;
5. Index, follow.
И т.д.
И каждая из них имеет право на жизнь в зависимости от проекта, задумки SEO`шника и текущей ситуации.
Считаю очень важным отчет Coverage -> Excluded в Google Search Console (ссылка), поскольку он может показать вам места в которых идет “утечка” краулингового бюджета, проблемы с дублями страниц, их качеством (thin content) и т.д.
При анализе одного из проектов в отчетах Excluded я нашел страницы вида “page=182”, которых точно не должно было быть на сайте (столько карточек просто нет). В этом проекте была открыта пагинация для страниц с алфавитным\предметным указателем. Этих страниц не много и они уникализированы + у предметного указателя есть поисковый интент, а значит, что они имеют право быть открытыми. К тому же, это позволяло сделать дополнительную линковку.
Так откуда же взялось множество page=182?
Пускай на сайте было 100 товаров по 10 на странице. Google прошел все 10 страниц и запомнил их. Далее происходит ситуация, что на сайте пропадает 20 товаров (в данном кейсе не важно по какой причине) и теперь у нас всего 8 страниц, но про 9 и 10-ую Google помнит и они есть в Scheduler`е на переобход и рано или поздно он на них зайдет еще раз. В данном кейсе сломалась пагинация и вместо редиректа на первую страницу или выдачи 404 ответа сервера при запросе несуществующей пагинации отдавалась страница 200ок без основного контента (только меню, сайдбар, футер) с кнопками “предыдущая” и “следующая страница”, которая вела дальше по +1 в бесконечность. Таким образом Google просто попал на 10-ую, которой не существовало на данный момент и шел 11,12,13,14…182,183… и в бесконечность. (То чувство, когда вылизанные статьи не попадают в индекс, а тысяча пустых страниц - попала).
Никто не застрахован от ошибок, а потому даже “точно работающие” и очевидные вещи стоит проверять. И это вполне нормально в развивающихся продуктах. Ошибок нет только у тех, кто ничего не делает.
Что стоит делать?
Добавить себе в чеклист периодической проверки:
1. Проверка того, как работает несуществующая пагинация;
2. Какие теги стоят на пагинации + какие http header отдают эти страницы (не забываем о существовании x-robots-tag);
3. Смотреть в Excluded отчет.
А даже, если у вас есть автоматические проверки, то не стоит пренебрегать и ручной проверкой. Кто вам сказал, что чекалка не сломана? 🙂
P.S. Следующий пост будет в среду 09.12.2020 около 22-00 по Киеву. Поговорим про JS рендеринг. И может я еще в ближайшее время напишу пост про свое мнение о том, как можно “готовить” пагинацию при разных начальных данных.
Источник новости https://t.me/productseo/14...