🌐Google VS машинний (автоматичний) переклад

1168

Хочу почати з того, що тема перекладеного контенту у SEO завжди була актуальною, тому вирішив взяти цю тему для посту.

❔Суть питання наступна, яка розбирається у пості:

Чи можна публікувати машинний переклад вмісту, якість якого лише незначно змінено.

На це питання відповіди співробітники Google — Ліззі Сассман і Джон Мюллер, на зустрічі «Office-Hours» (запитання подаються в письмовій формі, а потім даються відповіді)

Я досить часто цитую Джона Мюллера, Ліззі Сассман є технічним автором, який «піклується» про документацію Google Site Central.

❔Питання наступне:

«Сайт використовує машинний переклад, щоб пропонувати публікації іншими мовами. Вміст перевіряють перекладачі, і вони часто задоволені якістю після незначних змін. Це добре для Google?»

🗣️Ліззі Сассман з Google відповіла:

«Приємно чути, що люди-перекладачі задоволені, і це цілком нормально для Google, якщо в процесі перевірки бере участь людина. Це ключ. Те, на що вам потрібно стежити, — це переконатися, що якість залишається хорошою та добре працює для людей, які читають вміст».

У відповіді конкретно не сказано, чи підходять незначні правки, лише те, що якщо «люди-перекладачі» впораються з цим, то це має бути добре для Google.

❔Чи може бути так, що Google не перевіряє, чи є вміст машинним перекладом, а покладається на стандартні сигнали якості вмісту?

Треба звернути увагу на політику спаму Google

У документації для розробників Google про спам-вміст згадуються інструменти автоматичного перекладу тексту та прямо вказується, що це спам, за винятком тих випадків, коли задіяний людський елемент.

Ось що зазначено в документації Google 👇🏻:

«Приклади автоматично створеного вмісту спаму включають:

Текст, перекладений автоматизованим інструментом без перевірки персоналом або кураторства перед публікацією»

Отже, поки людина редагує машинно-перекладений вміст, Google з цим погодиться.

Крім того, у відео Google Office-Hours за квітень 2022 року Джон Мюллер згадав, як створений штучним інтелектом контент вважається спамом, а потім згадав автоматично перекладений вміст. Мюллер розповів про інструменти штучного інтелекту для створення контенту та порівняв їх із інструментами автоматичного перекладу.

Про виявлення машинного перекладу👇🏻:

Ця тема досліджується багато років. У дослідницькій статті від 2021 року (« Виявлення тексту з машинним перекладом через подібність тексту з двостороннім перекладом – завантаження PDF ») стверджується, що людям може бути складно виявити вміст, перекладений з однієї мови на іншу.

Наприклад, використовуючи 100 перекладених текстів, оцінювачі могли ідентифікувати лише трохи більше половини перекладених текстів.

🤔Дослідники відзначили:

«Середня точність становила 53,3% (55,0% для носіїв мови та 52,0% для неносіїв мови), що було близько до випадкового».

Підхід під назвою Text Similarity With Round-Trip Translation (TSRT) перевершив людських оцінювачів і отримав більше балів, ніж найсучасніші детектори перекладу, коли статтю було опубліковано в 2021 році.

Примітно, що ця техніка може визначити мову оригіналу перекладених текстів. Він також може визначити, який алгоритм перекладу виконав переклад.

«Результати оцінки показують, що TSRT перевершує інші методи з точністю до 90,2%. Крім того, TSRT також може ідентифікувати оригінального перекладача та мову перекладу з точністю 93,3% та 85,6% відповідно».

Підсумки👇🏻:

Незрозуміло, чи може Google виявляти перекладений вміст і чи Google взагалі намагається виявити перекладений вміст, але технологія його виявлення існує.

Якщо того факту, що це суперечить інструкціям для веб-майстрів і може мати негативну взаємодію з користувачем, недостатньо для мотивації до редагування машинно-перекладеного вмісту, то, можливо , Google аналізує якість вмісту для машинного перекладу може бути причиною для надання такого вмісту комплексний огляд.

Більш детальніше у 👉 цьому матеріалі.

Ссылки из поста:
– https://www.searchenginejournal.com/is-google-okay...

Источник новости https://t.me/seomnenie/154...

<< Вернуться на канал

04.11.2022 08:00