LLM под капотом@llm_under

LLM под капотом

Вот тот самый тайный первый промпт, который отвечает за самую сложную часть анализа документов в завершенном проекте (см выше). Там текста - кот наплакал, а вся логика зашита в response format (схему на полей 60-70). А дальше constrained decoding движок будет мучать модель, чтобы ответ был оформлен строго по плану анализа.

Причем анализ структурно простой - там даже нет раутинга, только каскады и пара циклов (см SGR patterns)

Второй промпт (генерация кода инструментов на базе результатов этого анализа) будет чуть побольше - нужно дать вводные:

(1) Ты извлекаешь данные такого типа из этого документа
(2) Напиши код, который сделает работу
(3) Результат предварительного анализа документа - вот этот JSON
(4) Сигнатура функции должна быть такая (включая описание схемы данных)
(5) смотри у меня, чтобы не ломаться на таких кейсах (список ошибок из прошлой итерации, если есть)

Зато response схема тут фактически с одним полем:


class PythonFunction(BaseModel):
    function_body: str

Ну а качество работы такой связки вы уже видели в картах ошибок

Ваш, @llm_under_hood 🤗

PS: Я еще упускаю часть пайплайна, которая делает всю тяжелую работу по поиску документов и их извлечению. В результате ее работы у нас задача сводится к аккуратному списку PDF-ок, из которых нужно извлечь данные. Там уже разные промпты под источник.

❤43🤝22👍16🔥10🙏3😁2🤣2

www.tgoop.com/llm_under_hood/661

10.8K viewsedited Sep 18 at 11:29

tgoop.com/llm_under_hood/661

Create: 2025-09-18
Last Update: 2025-10-08 22:42:37


class PythonFunction(BaseModel):
    function_body: str

BY LLM под капотом

Share with your friend now:
tgoop.com/llm_under_hood/661

Telegram News

Вот тот самый тайный первый промпт