Раздутый индекс из-за фасетной навигации: точные шаги, которые...
177
Раздутый индекс из-за фасетной навигации: точные шаги, которые срезали 89К страниц до 200 и дали буст трафика на 67%
Стандартная матрица фильтров e-commerce — 10 категорий × 20 цветов × 15 размеров × 10 брендов — генерит 30 000 возможных урлов, большинство из которых отдают почти идентичные сетки товаров.
На масштабе у одного клиента было 127 000 проиндексированных комбинаций фильтров, из которых только 200 несли реальную ценность.
Google краулил все это, ничего нормально не ранжировал и размазывал ссылочный вес по тысячам дублей.
Решение — не отключать фильтры, а хирургически контролировать, что именно краулер закидывает в индекс.
Пять путей внедрения, в порядке специфичности:
Самый грубый рычаг — обработка параметров в GSC (Search Console → Settings → Crawling → URL Parameters).
Каждому параметру задается одна из трех инструкций: No URLs для неконтентных параметров вроде трекинг-кодов и ID сессий; Representative URL для параметров, которые меняют контент, но где Google должен сам выбрать каноникал; Every URL только для параметров, генерирующих уникальные, индексируемые страницы.
Настройка 15 параметров таким образом сжала индекс одного клиента со 127 000 до 3 000 страниц только за счет этого.
Для параметров, которые GSC не может чисто разрулить, <meta name="robots" content="noindex"> на страницах фильтрации позволяет юзерам свободно фильтровать и сохраняет перетекание краулингового веса — Google проходит по ссылкам, но не индексирует конечный урл.
Более сильное архитектурное решение — каноникал со всех комбинаций фильтров обратно на главную страницу категории, что консолидирует сигналы ранжирования на одном урле.
Трейд-офф очевиден: это убивает возможность ранжироваться по запросам типа "red shoes size 10".
Заюзай это только когда комбинации фильтров имеют нулевую частотку, а страницы фильтров не должны ранжироваться независимо.
Стратегическая выборочная индексация — правильный подход для большинства сайтов.
Индексируй /shoes/, /shoes/red/, /shoes/nike/, /shoes/running/ — ВЧ-комбинации с одним фильтром.
Закрывай в noindex любой урл, несущий два или более параметра, либо комбинации без частотки.
Автоматизируй это на уровне шаблона: if (count($_GET) > 1) { echo '<meta name="robots" content="noindex">'; }.
Порог в 2+ параметра — это граница внедрения.
Комбинации с одним фильтром, которые стоит ранжировать, полностью вычисти из query string.
/shoes/?color=red становится /shoes/red/ — чистый путь директории, который выглядит как категория, поддерживает независимую оптимизацию тайтлов/мета и упрощает внутреннюю перелинковку.
Двадцать комбинаций, перестроенных таким образом, отранжировались за 6 недель.
Для небольших ассортиментов до 200 товаров обойди проблему полностью: снеси пагинацию и фильтры, загрузи все товары на один индексируемый урл, а фильтрацию повесь на клиентскую часть через JavaScript без изменения урлов.
Одна страница, ноль дублей.
Помониторь ежемесячно: чекай покрытие в GSC на предмет общего числа проиндексированных урлов (цель: только категории + ценные страницы с одним фильтром), пробивай site:example.com inurl:?, чтобы отловить просочившиеся урлы с параметрами, и краули через Screaming Frog для подсчета уникальных комбинаций параметров.
Без регулярных аудитов дисциплина индекса деградирует незаметно.
@MikeBlazerX
🚷 Закрытый канал: @MikeBlazerPRO
Ссылки из поста:– https://x.com/noelcetaSEO/status/20263037456219341...
– https://t.me/MikeBlazerX
– https://t.me/tribute/app?startapp=sE4X
Источник новости https://t.me/mikeblazerx/6227...

