SEOFAQ Telegram, маркетинг и SEO Канал SEOFAQT в мессенджере Telegram

Все чатыКейс: Пагинация. Проверка Coverage -> Excluded


Кейс: Пагинация. Проверка Coverage -> Excluded

#кейс_из_жизни #pagination @productseo

Есть множество используемых SEO`шниками схем по реализации пагинации (с точки зрения seo тегов):

1. Canonical на первую;

2. Noindex, follow, canonical self reference;

3. Noindex, follow;

4. Noindex, nofollow;

5. Index, follow.

И т.д.

И каждая из них имеет право на жизнь в зависимости от проекта, задумки SEO`шника и текущей ситуации.

Считаю очень важным отчет Coverage -> Excluded в Google Search Console (ссылка), поскольку он может показать вам места в которых идет “утечка” краулингового бюджета, проблемы с дублями страниц, их качеством (thin content) и т.д.

При анализе одного из проектов в отчетах Excluded я нашел страницы вида “page=182”, которых точно не должно было быть на сайте (столько карточек просто нет). В этом проекте была открыта пагинация для страниц с алфавитным\предметным указателем. Этих страниц не много и они уникализированы + у предметного указателя есть поисковый интент, а значит, что они имеют право быть открытыми. К тому же, это позволяло сделать дополнительную линковку.

Так откуда же взялось множество page=182?

Пускай на сайте было 100 товаров по 10 на странице. Google прошел все 10 страниц и запомнил их. Далее происходит ситуация, что на сайте пропадает 20 товаров (в данном кейсе не важно по какой причине) и теперь у нас всего 8 страниц, но про 9 и 10-ую Google помнит и они есть в Scheduler`е на переобход и рано или поздно он на них зайдет еще раз. В данном кейсе сломалась пагинация и вместо редиректа на первую страницу или выдачи 404 ответа сервера при запросе несуществующей пагинации отдавалась страница 200ок без основного контента (только меню, сайдбар, футер) с кнопками “предыдущая” и “следующая страница”, которая вела дальше по +1 в бесконечность. Таким образом Google просто попал на 10-ую, которой не существовало на данный момент и шел 11,12,13,14…182,183… и в бесконечность. (То чувство, когда вылизанные статьи не попадают в индекс, а тысяча пустых страниц - попала).

Никто не застрахован от ошибок, а потому даже “точно работающие” и очевидные вещи стоит проверять. И это вполне нормально в развивающихся продуктах. Ошибок нет только у тех, кто ничего не делает.

Что стоит делать?

Добавить себе в чеклист периодической проверки:

1. Проверка того, как работает несуществующая пагинация;

2. Какие теги стоят на пагинации + какие http header отдают эти страницы (не забываем о существовании x-robots-tag);

3. Смотреть в Excluded отчет.

А даже, если у вас есть автоматические проверки, то не стоит пренебрегать и ручной проверкой. Кто вам сказал, что чекалка не сломана? 🙂

P.S. Следующий пост будет в среду 09.12.2020 около 22-00 по Киеву. Поговорим про JS рендеринг. И может я еще в ближайшее время напишу пост про свое мнение о том, как можно “готовить” пагинацию при разных начальных данных.

Источник новости https://t.me/productseo/14...