Ложная ошибка 404 Пост по горячим следам - сегодня на проекте...
237
Ложная ошибка 404
Пост по горячим следам - сегодня на проекте добрался до этого типа ошибок. Ложная, или soft 404 - это ошибка, которую подсвечивает Гугл в своей консоли вебмастера; и не подсвечивает Яндекс (но может отобразить в одной из вкладок Яндекс Вебмастера).
К каким страницам применима эта ошибка?
Например, на вашей странице написано: "Ошибка 404, ничего не найдено, шеф, всё пропало, гипс снимают, клиент уезжает", но страница отдаёт код, как будто она существует.
Коды сервера - это один из ответов сервера клиенту (вашему браузеру, поисковому боту; всем, кто стучится в страницу). Сервер передаёт актуальное состояние страницы: документ существует и доступен, документ отсутствует, или он перенаправляет на другой адрес, доступен только после авторизации, что-то сломалось на сервере и поэтому документ не доступен и т.п.
Логично, что если страница не найдена / не существует - она возвращает код "не найдено" (он же 404). Если найдена и доступна - отдаётся код 200 ОК.
Но часто возникают ситуации, когда при разработке, обновлении или переезде сайта, если никто не проверит, разруливание этими кодами просто забывается. И страница как на скрине, вроде как показывающая "404 не найдено", возвращает код 200 ОК.
Google умный. Он сопоставляет контент страницы с отдаваемым кодом, и группирует в своей консоли вебмастера такие расхождения в ошибку "Ложная ошибка 404" (скрин 2).
Яндекс не группирует, не учитывает, но в Яндекс.Вебмастере есть раздел "Индексирование - Заголовки и описания", где выводятся страницы с одинаковыми заголовками (теги TITLE) и описаниями (мета-теги description).
TITLE - один из значимых тегов для страницы, и в идеале количество страниц с дублями этого тега нужно сводить к минимуму.
И в этом разделе страницы с soft 404 косвенно можно найти через дубли TITLE. В нашем случае это будет заголовок "Страница не найдена".
Зачем исправлять эту ошибку?
1. Доступные для поиска страницы с пустым содержимым - лишний мусор. На них тратится время переобхода ботами, при этом переобход важных страниц может быть реже, в силу траты ресурса на пустышки. Особенно важно для крупных проектов.
2. Большое количество страниц с одинаковым содержимым может ухудшать общую оценку сайта (хоста) - что может быть характерно для Яндекса. В справке Яндекса есть фразы "Если заголовки и описания дублируются, пользователям сложнее ориентироваться. Это ухудшает видимость сайта в поисковой выдаче", что вернее звучит так: "Если есть дубли заголовков и описаний, видимость сайта в поисковой выдаче будет ухудшена, чтобы пользователи не расстаивались, кликнув на ваш сайт и получив ненужный для них или дублирующийся контент".
Как исправить эту ошибку?
У Гугла есть рекомендации на все случаи.
Универсальный сценарий - страницы должны отдавать код 404. Это к разработке/админу. А для обоснования необходимости таких правок покажите этот пост 🤌
Ссылки из поста:– https://developers.google.com/search/docs/crawling...
Источник новости https://t.me/ecom_seo/43...

