SEOFAQ Telegram, маркетинг и SEO Канал SEOFAQT в мессенджере Telegram

Все чатыРаздутый индекс из-за фасетной навигации: точные шаги, которые...

 177  


Раздутый индекс из-за фасетной навигации: точные шаги, которые срезали 89К страниц до 200 и дали буст трафика на 67%

Стандартная матрица фильтров e-commerce — 10 категорий × 20 цветов × 15 размеров × 10 брендов — генерит 30 000 возможных урлов, большинство из которых отдают почти идентичные сетки товаров.

На масштабе у одного клиента было 127 000 проиндексированных комбинаций фильтров, из которых только 200 несли реальную ценность.

Google краулил все это, ничего нормально не ранжировал и размазывал ссылочный вес по тысячам дублей.

Решение — не отключать фильтры, а хирургически контролировать, что именно краулер закидывает в индекс.

Пять путей внедрения, в порядке специфичности:

Самый грубый рычаг — обработка параметров в GSC (Search Console → Settings → Crawling → URL Parameters).

Каждому параметру задается одна из трех инструкций: No URLs для неконтентных параметров вроде трекинг-кодов и ID сессий; Representative URL для параметров, которые меняют контент, но где Google должен сам выбрать каноникал; Every URL только для параметров, генерирующих уникальные, индексируемые страницы.

Настройка 15 параметров таким образом сжала индекс одного клиента со 127 000 до 3 000 страниц только за счет этого.

Для параметров, которые GSC не может чисто разрулить, <meta name="robots" content="noindex"> на страницах фильтрации позволяет юзерам свободно фильтровать и сохраняет перетекание краулингового веса — Google проходит по ссылкам, но не индексирует конечный урл.

Более сильное архитектурное решение — каноникал со всех комбинаций фильтров обратно на главную страницу категории, что консолидирует сигналы ранжирования на одном урле.

Трейд-офф очевиден: это убивает возможность ранжироваться по запросам типа "red shoes size 10".

Заюзай это только когда комбинации фильтров имеют нулевую частотку, а страницы фильтров не должны ранжироваться независимо.

Стратегическая выборочная индексация — правильный подход для большинства сайтов.

Индексируй /shoes/, /shoes/red/, /shoes/nike/, /shoes/running/ — ВЧ-комбинации с одним фильтром.

Закрывай в noindex любой урл, несущий два или более параметра, либо комбинации без частотки.

Автоматизируй это на уровне шаблона: if (count($_GET) > 1) { echo '<meta name="robots" content="noindex">'; }.

Порог в 2+ параметра — это граница внедрения.

Комбинации с одним фильтром, которые стоит ранжировать, полностью вычисти из query string.

/shoes/?color=red становится /shoes/red/ — чистый путь директории, который выглядит как категория, поддерживает независимую оптимизацию тайтлов/мета и упрощает внутреннюю перелинковку.

Двадцать комбинаций, перестроенных таким образом, отранжировались за 6 недель.

Для небольших ассортиментов до 200 товаров обойди проблему полностью: снеси пагинацию и фильтры, загрузи все товары на один индексируемый урл, а фильтрацию повесь на клиентскую часть через JavaScript без изменения урлов.

Одна страница, ноль дублей.

Помониторь ежемесячно: чекай покрытие в GSC на предмет общего числа проиндексированных урлов (цель: только категории + ценные страницы с одним фильтром), пробивай site:example.com inurl:?, чтобы отловить просочившиеся урлы с параметрами, и краули через Screaming Frog для подсчета уникальных комбинаций параметров.

Без регулярных аудитов дисциплина индекса деградирует незаметно.

@MikeBlazerX

🚷 Закрытый канал: @MikeBlazerPRO

Ссылки из поста:
https://x.com/noelcetaSEO/status/20263037456219341...
https://t.me/MikeBlazerX
https://t.me/tribute/app?startapp=sE4X

Источник новости https://t.me/mikeblazerx/6227...