SEOFAQ Telegram, маркетинг и SEO Канал SEOFAQT в мессенджере Telegram

Все чатыРебята, напоминаю, что я отвечаю на ваши вопросы по SEO или бизнесу


Ребята, напоминаю, что я отвечаю на ваши вопросы по SEO или бизнесу.

❓ Александр, здравствуйте! Расскажите, пожалуйста, понятным языком, что такое униграмма, би-грамм, три-грамм.

❗️ Сначала хочу сказать, что правильно говорить «биграмма» и «триграмма», и что происходят эти слова не от «граммов» (а от «грамма» - слово, часть слова) 😊

Существует n-грамма – это последовательность из n слов. Исходя из этого должно быть намного понятнее, что:

Униграмма – это одно слово,

Биграмма – два последовательных слова,

Триграмма – последовательность из трех слов.

N-граммы используются для индексирования данных в поисковых системах, для предугадывания последовательностей на основе вероятностных моделей, для определения текстовой релевантности.

На основании анализа устойчивых сочетаний из двух и трех слов (соответственно, биграммы, триграммы) и т.д. можно определять спамность текста, например.

Можно считать поисковые фразы, полученные из вордстата Яндекса, биграммами, триграммами и т.д., если они состоят из 2, 3 и т.д. слов. Если помните фильтр Баден-Баден, который Яндекс запустил в 2017 году, то одним из основных критериев попадания текста (страницы) под фильтр было использование частоупотребляемых n-грамм в большом количестве.

Грубо говоря, если взять поисковые фразы из 2, 3 и более слов и распихать их по тексту, большое количество n-грамм будет свидетельствовать высокой спамности и такой текст попадет под фильтр.

⚠️ Думаю, в контексте данного сообщения будет полезно мое исследование и практика работы с фильтром Баден-Баден: https://alaev.info/blog/post/5952

👉 Можете задавать ваши вопросы в комментариях или мне лично @VictimAlex

Источник новости https://t.me/alaevseo/99...