Канал SEOFAQT в мессенджере Telegram

Инженер Google подтверждает: ИИ вырезает из 30 000 документов...

Mike Blazer

157

Инженер Google подтверждает: ИИ вырезает из 30 000 документов всего 117 URL для генерации ответов

Чтобы выжить в ИИ-выдаче, страница обязана пройти жесткий алгоритмический фильтр.

Ранжирование LLM лопатит триллионы токенов и отбирает базу из 30 000 документов, палит Гленн Гейб ссылаясь на Джеффа Дина из Google.

Этот первый пул содержит около 30 миллионов токенов.

Затем алгоритм жестко сжимает эту массу ровно до 117 приоритетных документов.

Только эти выжившие URLs уходят в архитектуру RAG на финальную обработку.

Это математическое горлышко заставляет страницу сначала занять Топ-100 в классическом серпе.

Иначе бот даже не начнет анализ.

Дальше выживание URL определяет синтаксис.

Запрещено пихать несколько разных утверждений в одну строку.

Это создает перегруженное предложение, пишет Кришна Мадхавин из Microsoft.

Такая плотность текста наглухо ломает парсер.

Сложная структура сбивает извлечение связей между энтити и блокирует маппинг триплетов на этапе индексации.

Система тупо не может связать конкретные сущности с их действиями.

Чтобы обойти эту ловушку алгоритма, изолируйте каждый факт в отдельное короткое предложение.

@MikeBlazerX

⚠️ Закрытый канал: @MikeBlazerPRO

Ссылки из поста:
– https://www.youtube.com/watch?v=-4GCfJRadj4&t=166s
– https://t.me/MikeBlazerX
– https://t.me/tribute/app?startapp=sE4X

Источник новости https://t.me/mikeblazerx/6392...

<< Вернуться на канал

18.05.2026 10:15