Джейк Бохолл создал 2 файла PDF, добавил x-robots-tag...
1488
Джейк Бохолл создал 2 файла PDF, добавил x-robots-tag "noindex" к одному и "noindex,indexifembedded" к другому.
PDF с "noindex,indexifembedded" Гугл проиндексировал. Что немного странно, учитывая, что Джейк думал, что он не будет проиндексирован и что тег позволит содержимому пдф "эмбеднуться" в веб-страницы.
Затем Джейк внедрил два PDF файла на две разные страницы, которые были открыты для краулинга/индексации (так эти PDF в первую очередь и были обнаружены).
Страница A - Содержит встроенный noindex PDF
Страница B - Содержит встроенный noindex, indexifembedded PDF
Обе страницы проиндексированы. У Джейка сложилось впечатление, что этот тег решает проблему, когда встраиваемая страница может быть не проиндексирована, потому что она встраивает неиндексируемый контент.
Что касается контента, пока что PDF является единственным результатом в поиске, по уникальному контенту с PDF, а не веб-страница.
Или этот тег не работает, или PDF являются исключением?
Оба файла PDF были доставлены с X-Robots-Tags через HTTP-заголовки.
Сам файл PDF Гугл выбрал в качестве канонической версии.
Обратите внимание, они не отправляли каноникал заголовок для PDF, так как у них также есть noindex для PDF...
Вот такой вот детектив с пдфками.
@MikeBlazerX
Ссылки из поста:– https://twitter.com/jakebohall/status/155432102582...
– https://t.me/MikeBlazerX
Источник новости https://t.me/mikeblazerx/403...

