Исследование индексации, анализирующее 1.7 миллиона страниц на...
66
Исследование индексации, анализирующее 1.7 миллиона страниц на 18 сайтах, показало, что 88% страниц, не проиндексированных Google, не попали в индекс из-за проблем с качеством.
Google активно удаляет страницы из результатов поиска или позволяет им быть забытыми.
Основная причина, по которой важные страницы не индексируются – этот активный процесс удаления и забывания.
Методология исследования включала:
— Мониторинг 1.7 миллиона важных страниц, добавленных в сайтмап, на 18 разных сайтах.
— Получение вердиктов индексации (Проиндексировано vs Не проиндексировано) через URL Inspection API.
— Использование снимка данных от 31/03/2025, включая только страницы с однозначными вердиктами.
Ключевые выводы:
— Маркетплейсы и сайты с листингами показали самый низкий показатель покрытия индексом (проиндексированные vs отслеживаемые страницы) – менее 70%. Новостные сайты имели лучший результат (97%), а интернет-магазины – ниже 90%. (Желательный показатель – более 90%).
— Наложение данных о траст сайта от Moz показало, что как малые, так и крупные бренды сталкиваются с проблемами индексации, с показателями покрытия индексом обычно 85-91%.
— Интернет-магазины, маркетплейсы и сайты с листингами демонстрировали более низкие средние показатели покрытия индексом независимо от размера бренда.
Последовательно, проблемы с качеством оказались основной причиной (88%) неиндексации среди отслеживаемых страниц.
"Качество" определяется как активное удаление проиндексированных страниц или забывание непроиндексированных страниц Google со временем.
Разбивка категории проблем с качеством:
— "URL неизвестен Google" и "Обнаружено - в настоящее время не проиндексировано" составляют 67% непроиндексированных страниц из-за проблем с качеством.
— Исследования показывают, что эти состояния, наряду с "Прокраулено - в настоящее время не проиндексировано", часто представляют проблемы индексации (активное удаление/забывание), а не чисто краулинговые проблемы, что требует переосмысления. GSC может неправильно отображать эти состояния для забытых страниц.
Это доминирование проблем с качеством сохранялось при группировке страниц по:
— Авторитету бренда Moz: Затрагивает бренды всех размеров.
— Типу сайта: Преобладает для интернет-магазинов, маркетплейсов и сайтов с листингами. (Новостные сайты, однако, страдали больше от технических проблем индексации).
— Размеру сайта: Влияет на малые и крупные сайты. (Исключение: Сайты, отслеживающие 100k-500k страниц, в основном новостные).
Масштаб проблем с качеством и выявление того, что GSC неверно отображает состояния типа "Прокраулено - в настоящее время не проиндексировано" и "URL неизвестен Google" для забытых страниц, были значительными.
Данные, потенциально находящиеся под влиянием апдейта ядра от 13 марта, подчеркивают, что недостатки качества приводят к выпадению страниц из индекса.
По мере того, как Google совершенствует алгоритмы, все больше важных страниц может столкнуться с удалением.
https://indexinginsight.substack.com/p/new-study-the-biggest-reason-why
@MikeBlazerX
– https://t.me/MikeBlazerX
Источник новости https://t.me/mikeblazerx/5010...