Дэн Петрович на ту же тему: 1) LLM понимают разметку schema.org...

265

Дэн Петрович на ту же тему:

1) LLM понимают разметку schema.org, когда видят ее во входных данных, вопреки мнению о том, что структурированные данные теряются в процессе токенизации; LLM обучаются на ней также, как на коде.

2) LLM не всегда видят schema.org во входных данных, потому что большинство инструментов и функций, предоставляющих контекст модели, удаляют ее во время предварительной обработки.

3) Инструменты, используемые ИИ-системами для обработки контента, передающегося LLM в качестве контекста, иногда анализируют HTML-страницу, используя структурированные данные для лучшего понимания страницы, а иногда — нет. Это решение разработчика программного обеспечения, никак не связанное с возможностями LLM.

TL;DR: LLM понимают структурированные данные, если они их получают, но в большинстве случаев они получают простой текст / текст с разметкой markdown.

Ссылки из поста:
– https://x.com/dejanseo/status/1968445743750070748

Источник новости https://t.me/notjohnmu/2280...

<< Вернуться на канал

18.09.2025 19:48