Google преобразует PDF в HTML для индексации (+ обнаруживает...

690

Google преобразует PDF в HTML для индексации (+ обнаруживает ссылки/якоря). Он берет заголовок документа и используют его в качестве элемента <title> в HTML. Несмотря на большинство руководств по SEO, тема (subject) не используется для мета-описания, Гугл не присваивает заголовки тегированному тексту PDF и не видит alt-текст.

Об этом Джон Мюллер писал еще в 2018 году.

Гугл добавляет номера страниц в HTML. Он распознает изображения, но только в том случае, если PDF является чистым изображением, а не сочетанием текста и изображений.

Источник

Довольно бесполезный/забавный факт - хотя Bing не использует мета киворды при ранжировании, он анализирует ключевые слова свойств PDF-файла в HTML-таблице и использует их при ранжировании - наряду с названием, автором, темой и датой создания.

@MikeBlazerX