💾 Извините, но не сейчас.. или Обнаружена, но не проиндексирована
40
💾 Извините, но не сейчас.. или Обнаружена, но не проиндексирована
В Google консоли есть 2 замечательных статуса индексации страниц (описание из справки Google):
🔸 Страница просканирована, но пока не проиндексирована. В дальнейшем она может быть проиндексирована, а может и остаться в текущем состоянии
🔸 Обнаружена, не проиндексирована. Это сообщение означает, что мы нашли страницу, но пока не добавили ее в индекс Google. Обычно это объясняется тем, что роботу Google не удалось просканировать сайт, поскольку это могло привести к чрезмерной загрузке ресурса, и сканирование было перенесено на более поздний срок.
🙄 С которым массово сталкиваются, в большей мере:
- Новые сайты, которые впервые заходят в индекс и имеют сложности с уникальностью контента на страницах
- Габаритные сайты с большим количеством страниц, чаще однотипных (например, страницы карточек товаров)
- После массового изменения URL адресов (ситуация, в которой еще вчера страницы были в индексе, после смены - Гугл посчитал иначе)
- Сайты с большим количеством товаров Нет в наличии, Google также может отправлять их в этот статус
- Сайты с дублирующим контентом (не всегда в консоли дубликаты попадают именно в статус дублирующий контент).
Ближе к сути:
В 2019 году Джон Мюллер из Гугл оставил такой 👉комментарий по теме:
Мы не обещаем обход и индексацию всего контента. В интернете куча всего, и было бы непрактично включать всё, мы должны расставить приоритеты. Это не означает, что со страницами что-то не то, наши алгоритмы не видят смысла включать все страницы с вашего сайта.
Это нормально, позже возможны изменения, это не является признаком технической проблемы.
Одним из выходов, в таких случаях, это сосредоточить свои усилия на содержании проиндексированных, объединить похожие страницы, удалить ненужные страницы, делать более уникальный и интересный контент на страницах вашего сайта (или все эти шаги).
Так какой состав таблетки?
Перед тем, как прописывать рецепт, нужно:
- Проанализировать консоль, по сути, нужно найти закономерности в исключенных страницах и понять, какой именно тип(ы) страниц уходят в этот статус.
- Выборочно проверить страницы через оператор site:, может быть ложная тревога и странички будут в индексе
- После чего, попытаться разглядеть, чем они отличаются от тех, которые зашли в индекс (и это может быть не так очевидно и просто)
- Посмотреть, как выглядят такие же страницы у ваших конкурентов.
Конечно же, в плане потенциального решения, речь идет именно о ситуации, в которой в этот статус попадают нужные вам страницы, а не мусор, который достаточно просто закрыть или не выполнять никаких действий. Например, если это страницы товаров, по которым есть микро НЧ запросы по артикулам и т.д. - проект может недополучать органику.
Решение состоит из 3 частей (на примере страниц товаров):
1. Уникализирумем контент страниц путем шаблонизации и уник контента:
- Уникализировать URL (комментарий Джона Мюллера из 👉этого поста: Google может «потеряться» в большом количестве сгенерированных страниц с похожими URL, например, различающихся регистром или атрибутами. Если на сайте действительно много дублированных URL, их индексация не требуется, переходите к следующему пункту.)
- Уникализировать заголовок H1, мета описание и title
- Наличие конкретики (цены и др. информации)
- Наличие полных технических характеристик
- Наличие фотографий продукта
- Какие инфоблоки дублируются на всех страницах (что нужно убрать/что нужно добавить)
- Какие блоки перелинковки размещены (например, есть ли блок Другие товары)
2. Сократить количество однотипных товаров, если это возможно
3. Время на переиндексацию
п.с. один из лучших материалов по теме 👉тут
Источник новости https://t.me/seomnenie/101...