tgoop.com/PromptLab_Mozlab/173
Last Update:
Промптинг устарел, данные рулят! Мой опыт работы с данными для получения блестящих результатов от нейросетей
Хм, а это только у меня теперь работа с нейросетями — это на 70% подготовка данных и только 30% — собственно промптинг?
Поймал себя на мысли, что у меня возникла довольно продвинутая система предподготовки данных для работы с нейросетями. Я бы даже слегка выпендрился и сказал, что создаю свою нейросеть с «вручную управляемой» технологией RAG (Retrieval-Augmented Generation, в комментах подробнее).
Как устроена моя система хранения предподготовленых данных?
1. Папка с книгами по важным темам (с реальной книгой ИИ работает лучше, чем со своими «воспоминаниями» о ней). Плюс ссылки на реальные страницы
2. Папки с файлами с длинными промптами (удобнее, чем гонять между разными нейросетями, выискивая и копируя из одной в другую)
3. Специальный личный Тг-канал с промптами и находками, где темы = сообщения, а промпты и интересные находки = комменты (иначе не протолкнуться от длинных полотен)
4. (!) Папка с «цифровыми двойниками» людей, их контента и других полезностей, чтобы не искать и сразу давать полный контекст, если приспичит что-то спросить или поискать
* Файл со всеми постами моего основного канала
* Файл со всеми постами канала моей жены-психолога
* Файл со всеми постами канала моей дочери-кинопродюсера
* Файл про собаку дочери с кучей ветеринарной инфо
* Файл про меня рабочего, ещё один — про меня нерабочего
* Файл про то, как организован маркетинг у нас в компании
… и ещё две дюжины всякого
5. Папка с образцами удачных ответов нейросети по разными темам (чтобы быстро дать и сказать: «примерно так!»)
6. Ещё куча всего
Понимаете?
Когда мне надо решить какую-то задачу (например, дочка советуется по поводу того, какую работу выбрать) — у меня все готово для того, чтобы мгновенно скормить нейросети увесистый пакет данных и получить предельно точный ответ. И это прекрасно, потому что никакой промпт не даст такой точности (разве что в него всю эту информацию скопировать).
А когда я сталкиваюсь с полезным контентом (или получаю классный ответ) — я тут же закидываю его в соответствующую папку.
Я — продвинутый пользователь?
Эх, не зря, не зря Альтман сказал в том недавнем интервью, что молодежь, дескать, организует работу с нейросетью весьма навороченным образом:
«Они действительно используют его как операционную систему. Эм, у них есть сложные способы его настройки, чтобы подключать к куче файлов, и у них в голове или, знаете, где-то, куда они копируют и вставляют, запомнены довольно сложные промпты, и, эм, то, я думаю, все это круто и впечатляюще»
Хотя разве я молодежь?;) Но, впрочем, я уже писал, что корректнее было бы сказать: продвинутые и обычные пользователи нейросети.
А почему бы не хранить всё это внутри нейросети?
Потому что это влияет на контекст ответов. Читая ответ ЧатГПТ, который уже накопил кучу контекста по мне, я сталкиваюсь с предвзятыми ответами (в первую очередь, из файлов и книг, которые я загружал). Особенно если запускаю новый чат из папки проекта — там вообще кошмар. Просто новый чат — полегче, но все равно заметно, что он использует накопленные данные обо мне.
А заходя, к примеру, в Гемини, который контент не копит — я получаю «чистые» акценты. Менее предвзятые. Но для качественного ответа, очевидно, нужны исчерпывающие данные. Получается, собирая и структурируя данные для формирования конкретного запроса, я спасаюсь из тщательно формирующегося для меня пузыря. И заодно — никаких галлюцинаций!
Ну и попутно формирую цифровую копию моей жизни. Как и говорил Альтман.
А как у вас?
Какие папки, промпты и предзаготовленные данные у вас есть? Или вы этим не занимаетесь и просто промптите «с листа»? Пишите в комментариях и заполняйте опрос!
BY Лаборатория Промптинга Замышляева
Share with your friend now:
tgoop.com/PromptLab_Mozlab/173