🌐Google VS машинний (автоматичний) переклад
1119
🌐Google VS машинний (автоматичний) переклад
Хочу почати з того, що тема перекладеного контенту у SEO завжди була актуальною, тому вирішив взяти цю тему для посту.
❔Суть питання наступна, яка розбирається у пості:
Чи можна публікувати машинний переклад вмісту, якість якого лише незначно змінено.
На це питання відповіди співробітники Google — Ліззі Сассман і Джон Мюллер, на зустрічі «Office-Hours» (запитання подаються в письмовій формі, а потім даються відповіді)
Я досить часто цитую Джона Мюллера, Ліззі Сассман є технічним автором, який «піклується» про документацію Google Site Central.
❔Питання наступне:
«Сайт використовує машинний переклад, щоб пропонувати публікації іншими мовами. Вміст перевіряють перекладачі, і вони часто задоволені якістю після незначних змін. Це добре для Google?»
🗣️Ліззі Сассман з Google відповіла:
«Приємно чути, що люди-перекладачі задоволені, і це цілком нормально для Google, якщо в процесі перевірки бере участь людина. Це ключ. Те, на що вам потрібно стежити, — це переконатися, що якість залишається хорошою та добре працює для людей, які читають вміст».
У відповіді конкретно не сказано, чи підходять незначні правки, лише те, що якщо «люди-перекладачі» впораються з цим, то це має бути добре для Google.
❔Чи може бути так, що Google не перевіряє, чи є вміст машинним перекладом, а покладається на стандартні сигнали якості вмісту?
Треба звернути увагу на політику спаму Google
У документації для розробників Google про спам-вміст згадуються інструменти автоматичного перекладу тексту та прямо вказується, що це спам, за винятком тих випадків, коли задіяний людський елемент.
Ось що зазначено в документації Google 👇🏻:
«Приклади автоматично створеного вмісту спаму включають:
Текст, перекладений автоматизованим інструментом без перевірки персоналом або кураторства перед публікацією»
Отже, поки людина редагує машинно-перекладений вміст, Google з цим погодиться.
Крім того, у відео Google Office-Hours за квітень 2022 року Джон Мюллер згадав, як створений штучним інтелектом контент вважається спамом, а потім згадав автоматично перекладений вміст. Мюллер розповів про інструменти штучного інтелекту для створення контенту та порівняв їх із інструментами автоматичного перекладу.
Про виявлення машинного перекладу👇🏻:
Ця тема досліджується багато років. У дослідницькій статті від 2021 року (« Виявлення тексту з машинним перекладом через подібність тексту з двостороннім перекладом – завантаження PDF ») стверджується, що людям може бути складно виявити вміст, перекладений з однієї мови на іншу.
Наприклад, використовуючи 100 перекладених текстів, оцінювачі могли ідентифікувати лише трохи більше половини перекладених текстів.
🤔Дослідники відзначили:
«Середня точність становила 53,3% (55,0% для носіїв мови та 52,0% для неносіїв мови), що було близько до випадкового».
Підхід під назвою Text Similarity With Round-Trip Translation (TSRT) перевершив людських оцінювачів і отримав більше балів, ніж найсучасніші детектори перекладу, коли статтю було опубліковано в 2021 році.
Примітно, що ця техніка може визначити мову оригіналу перекладених текстів. Він також може визначити, який алгоритм перекладу виконав переклад.
«Результати оцінки показують, що TSRT перевершує інші методи з точністю до 90,2%. Крім того, TSRT також може ідентифікувати оригінального перекладача та мову перекладу з точністю 93,3% та 85,6% відповідно».
Підсумки👇🏻:
Незрозуміло, чи може Google виявляти перекладений вміст і чи Google взагалі намагається виявити перекладений вміст, але технологія його виявлення існує.
Якщо того факту, що це суперечить інструкціям для веб-майстрів і може мати негативну взаємодію з користувачем, недостатньо для мотивації до редагування машинно-перекладеного вмісту, то, можливо , Google аналізує якість вмісту для машинного перекладу може бути причиною для надання такого вмісту комплексний огляд.
Більш детальніше у 👉 цьому матеріалі.
Ссылки из поста:– https://www.searchenginejournal.com/is-google-okay...
Источник новости https://t.me/seomnenie/154...