🏙🌆 Дубльований контент: чи існує відсотковий поріг дублювання вмісту
753
🏙🌆 Дубльований контент: чи існує відсотковий поріг дублювання вмісту
Джон Мюллер з Google нещодавно відповів на запитання про те, чи існує відсотковий поріг дублювання вмісту, який Google використовує для ідентифікації та фільтрації дублікатів вмісту.
❔Питання було таким:
«…чи є відсоток дублікатів вмісту? Наприклад, чи маємо ми намагатися переконатися, що сторінки є принаймні на 72,6 відсотка унікальними, ніж інші сторінки нашого сайту? Чи вимірює це Google?»
🗣️Джон Мюллер з Google 👉відповів що такого числа немає.
❔Але, давайте детальнише - як Google виявляє повторюваний вміст👇🏻
Методологія Google для виявлення дублікатів вмісту залишалася надзвичайно схожою протягом багатьох років. У 2013 році Метт Каттс ( @mattcutts ), тодішній інженер-програміст Google , опублікував офіційне відео Google, в якому описується, як Google виявляє дублікати вмісту.
«Важливо розуміти, що якщо ви подивитеся на вміст в Інтернеті, приблизно 25% або 30% усього вмісту в Інтернеті є дубльованим вмістом. …Люди цитуватимуть абзац із блогу, а потім посилатимуться на блог, тощо».
Далі він сказав, що через те, що дубльований вміст є невинним і не містить спаму, Google не буде карати такий вміст. За його словами, покарання веб-сторінок за дублювання вмісту матиме негативний вплив на якість результатів пошуку.
❔Що Google робить, коли знаходить повторюваний вміст:
🗣️Також цитата Метта Каттса:
«Це просто розглядається як щось, що нам потрібно належним чином кластеризувати. І нам потрібно переконатися, що він має правильний рейтинг».
Він пояснив, що потім Google вибирає, яку сторінку показувати в результатах пошуку, і що він фільтрує дублікати сторінок, щоб покращити взаємодію з користувачем.
❔Як Google обробляє повторюваний вміст – версія 2020
У 2020 році Google опублікував епізод подкасту Search Off the Record, у якому та сама тема описана надзвичайно схожою мовою.
Ось відповідний розділ цього подкасту з 06:44 хвилини епізоду:
Гері Ілліс пояснює технічними термінами, як саме вони це роблять. По суті, Google не дивиться точно на відсотки, а скоріше порівнює контрольні суми. Контрольну суму можна назвати представленням вмісту у вигляді ряду цифр або літер. Отже, якщо вміст повторюється, послідовність чисел контрольної суми буде подібною.
⬇️ Висновки:
Тож коли говорити про дубльований вміст, ймовірно, справа не в пороговому відсотковому значенні, де є число, за якого вміст вважається дубльованим.
Натомість повторюваний вміст виявляється за допомогою представлення вмісту у вигляді контрольної суми, а потім ці контрольні суми порівнюються.
Додатковим висновком є те, що, здається, існує різниця між тим, коли частина вмісту є дублікатом, і коли весь вміст є дублікатом.
Детальніше у 👉 цьому матеріалі.
Ссылки из поста:– https://twitter.com/johnmu/status/1573350829788119...
– https://search-off-the-record.libsyn.com/transcrip...
– https://www.searchenginejournal.com/google-on-perc...
Источник новости https://t.me/seomnenie/151...