Дэн Петрович на ту же тему: 1) LLM понимают разметку schema.org...
Дэн Петрович на ту же тему:
1) LLM понимают разметку schema.org, когда видят ее во входных данных, вопреки мнению о том, что структурированные данные теряются в процессе токенизации; LLM обучаются на ней также, как на коде.
2) LLM не всегда видят schema.org во входных данных, потому что большинство инструментов и функций, предоставляющих контекст модели, удаляют ее во время предварительной обработки.
3) Инструменты, используемые ИИ-системами для обработки контента, передающегося LLM в качестве контекста, иногда анализируют HTML-страницу, используя структурированные данные для лучшего понимания страницы, а иногда — нет. Это решение разработчика программного обеспечения, никак не связанное с возможностями LLM.
TL;DR: LLM понимают структурированные данные, если они их получают, но в большинстве случаев они получают простой текст / текст с разметкой markdown.
Ссылки из поста:– https://x.com/dejanseo/status/1968445743750070748
Источник новости https://t.me/notjohnmu/2280...
251 
