Fan-Out запросы ChatGPT манипулируют весами векторов через...
67
Fan-Out запросы ChatGPT манипулируют весами векторов через облака синонимов
Fan-out запросы в ChatGPT недавно значительно расширились, прыгнув со средних 5 слов до 15.
Это не рандомный шум; это решает фундаментальный баг в семантическом поиске.
Если вы строили семантический поиск, вы знаете эту боль: поиск по lawyer fees, lawyer credentials и lawyer experience часто возвращает одну и ту же общую страницу "About Us".
Ключ "lawyer" доминирует в эмбеддинге, делая специфический интент нерелевантным.
Короткие запросы делят свой "вес" поровну между словами.
В запросе типа lawyer credentials, эмбеддинг — это грубо половина "lawyer" и половина "credentials".
Поскольку тема матчится так сильно, нюансы теряются.
Решение, которое мы видим в деплое — облака синонимов для управления направлением эмбеддинга.
Добавляя синонимы для угла (angle), но упоминая тему только один раз, вы размываете вес темы и тянете эмбеддинг в сторону конкретного интента.
Например, расширение запроса до "lawyer qualifications credentials licensing certifications experience" сдвигает веса.
Эмбеддинг теперь примерно 20% "lawyer" и 80% "credentials cluster".
Вектор теперь указывает конкретно на то, что реально хочет юзер.
Это не просто стандартное расширение запроса; это прецизионная развесовка.
Результат: разные интенты поднимают разный контент, позволяя специализированному deep-dive контенту побеждать общие странички, где просто упомянуто все подряд.
Это создает лучшее разнообразие и значительно более полезный retreival для RAG.
Недавнее расширение подсказывает, что они чаще дергают внутренний кеш или индекс, чтобы форсировать эту изоляцию интента.
@MikeBlazerX
Закрытый канал: @MikeBlazerPRO
Ссылки из поста:– https://x.com/top5seo/status/1998793512150765959
– https://t.me/MikeBlazerX
– https://t.me/tribute/app?startapp=sE4X
Источник новости https://t.me/mikeblazerx/6078...

