🏙🌆 Дубльований контент: чи існує відсотковий поріг дублювання вмісту

800

Джон Мюллер з Google нещодавно відповів на запитання про те, чи існує відсотковий поріг дублювання вмісту, який Google використовує для ідентифікації та фільтрації дублікатів вмісту.

❔Питання було таким:

«…чи є відсоток дублікатів вмісту? Наприклад, чи маємо ми намагатися переконатися, що сторінки є принаймні на 72,6 відсотка унікальними, ніж інші сторінки нашого сайту? Чи вимірює це Google?»

🗣️Джон Мюллер з Google 👉відповів що такого числа немає.

❔Але, давайте детальнише - як Google виявляє повторюваний вміст👇🏻

Методологія Google для виявлення дублікатів вмісту залишалася надзвичайно схожою протягом багатьох років. У 2013 році Метт Каттс ( @mattcutts ), тодішній інженер-програміст Google , опублікував офіційне відео Google, в якому описується, як Google виявляє дублікати вмісту.

«Важливо розуміти, що якщо ви подивитеся на вміст в Інтернеті, приблизно 25% або 30% усього вмісту в Інтернеті є дубльованим вмістом. …Люди цитуватимуть абзац із блогу, а потім посилатимуться на блог, тощо».

Далі він сказав, що через те, що дубльований вміст є невинним і не містить спаму, Google не буде карати такий вміст. За його словами, покарання веб-сторінок за дублювання вмісту матиме негативний вплив на якість результатів пошуку.

❔Що Google робить, коли знаходить повторюваний вміст:

🗣️Також цитата Метта Каттса:

«Це просто розглядається як щось, що нам потрібно належним чином кластеризувати. І нам потрібно переконатися, що він має правильний рейтинг».

Він пояснив, що потім Google вибирає, яку сторінку показувати в результатах пошуку, і що він фільтрує дублікати сторінок, щоб покращити взаємодію з користувачем.

❔Як Google обробляє повторюваний вміст – версія 2020

У 2020 році Google опублікував епізод подкасту Search Off the Record, у якому та сама тема описана надзвичайно схожою мовою.

Ось відповідний розділ цього подкасту з 06:44 хвилини епізоду:

Гері Ілліс пояснює технічними термінами, як саме вони це роблять. По суті, Google не дивиться точно на відсотки, а скоріше порівнює контрольні суми. Контрольну суму можна назвати представленням вмісту у вигляді ряду цифр або літер. Отже, якщо вміст повторюється, послідовність чисел контрольної суми буде подібною.

⬇️ Висновки:

Тож коли говорити про дубльований вміст, ймовірно, справа не в пороговому відсотковому значенні, де є число, за якого вміст вважається дубльованим.

Натомість повторюваний вміст виявляється за допомогою представлення вмісту у вигляді контрольної суми, а потім ці контрольні суми порівнюються.

Додатковим висновком є те, що, здається, існує різниця між тим, коли частина вмісту є дублікатом, і коли весь вміст є дублікатом.

Детальніше у 👉 цьому матеріалі.

Ссылки из поста:
– https://twitter.com/johnmu/status/1573350829788119...
– https://search-off-the-record.libsyn.com/transcrip...
– https://www.searchenginejournal.com/google-on-perc...

Источник новости https://t.me/seomnenie/151...

<< Вернуться на канал

14.10.2022 08:00