PROMPTLAB_MOZLAB Telegram 173
Промптинг устарел, данные рулят! Мой опыт работы с данными для получения блестящих результатов от нейросетей

Хм, а это только у меня теперь работа с нейросетями — это на 70% подготовка данных и только 30% — собственно промптинг?

Поймал себя на мысли, что у меня возникла довольно продвинутая система предподготовки данных для работы с нейросетями. Я бы даже слегка выпендрился и сказал, что создаю свою нейросеть с «вручную управляемой» технологией RAG (Retrieval-Augmented Generation, в комментах подробнее).

Как устроена моя система хранения предподготовленых данных?

1. Папка с книгами по важным темам (с реальной книгой ИИ работает лучше, чем со своими «воспоминаниями» о ней). Плюс ссылки на реальные страницы

2. Папки с файлами с длинными промптами (удобнее, чем гонять между разными нейросетями, выискивая и копируя из одной в другую)

3. Специальный личный Тг-канал с промптами и находками, где темы = сообщения, а промпты и интересные находки = комменты (иначе не протолкнуться от длинных полотен)

4. (!) Папка с «цифровыми двойниками» людей, их контента и других полезностей, чтобы не искать и сразу давать полный контекст, если приспичит что-то спросить или поискать

* Файл со всеми постами моего основного канала
* Файл со всеми постами канала моей жены-психолога
* Файл со всеми постами канала моей дочери-кинопродюсера
* Файл про собаку дочери с кучей ветеринарной инфо
* Файл про меня рабочего, ещё один — про меня нерабочего
* Файл про то, как организован маркетинг у нас в компании
… и ещё две дюжины всякого

5. Папка с образцами удачных ответов нейросети по разными темам (чтобы быстро дать и сказать: «примерно так!»)

6. Ещё куча всего

Понимаете?

Когда мне надо решить какую-то задачу (например, дочка советуется по поводу того, какую работу выбрать) — у меня все готово для того, чтобы мгновенно скормить нейросети увесистый пакет данных и получить предельно точный ответ. И это прекрасно, потому что никакой промпт не даст такой точности (разве что в него всю эту информацию скопировать).

А когда я сталкиваюсь с полезным контентом (или получаю классный ответ) — я тут же закидываю его в соответствующую папку.

Я — продвинутый пользователь?

Эх, не зря, не зря Альтман сказал в том недавнем интервью, что молодежь, дескать, организует работу с нейросетью весьма навороченным образом:

«Они действительно используют его как операционную систему. Эм, у них есть сложные способы его настройки, чтобы подключать к куче файлов, и у них в голове или, знаете, где-то, куда они копируют и вставляют, запомнены довольно сложные промпты, и, эм, то, я думаю, все это круто и впечатляюще»

Хотя разве я молодежь?;) Но, впрочем, я уже писал, что корректнее было бы сказать: продвинутые и обычные пользователи нейросети.

А почему бы не хранить всё это внутри нейросети?

Потому что это влияет на контекст ответов. Читая ответ ЧатГПТ, который уже накопил кучу контекста по мне, я сталкиваюсь с предвзятыми ответами (в первую очередь, из файлов и книг, которые я загружал). Особенно если запускаю новый чат из папки проекта — там вообще кошмар. Просто новый чат — полегче, но все равно заметно, что он использует накопленные данные обо мне.

А заходя, к примеру, в Гемини, который контент не копит — я получаю «чистые» акценты. Менее предвзятые. Но для качественного ответа, очевидно, нужны исчерпывающие данные. Получается, собирая и структурируя данные для формирования конкретного запроса, я спасаюсь из тщательно формирующегося для меня пузыря. И заодно — никаких галлюцинаций!

Ну и попутно формирую цифровую копию моей жизни. Как и говорил Альтман.

А как у вас?

Какие папки, промпты и предзаготовленные данные у вас есть? Или вы этим не занимаетесь и просто промптите «с листа»? Пишите в комментариях и заполняйте опрос!
🔥1811👍3



tgoop.com/PromptLab_Mozlab/173
Create:
Last Update:

Промптинг устарел, данные рулят! Мой опыт работы с данными для получения блестящих результатов от нейросетей

Хм, а это только у меня теперь работа с нейросетями — это на 70% подготовка данных и только 30% — собственно промптинг?

Поймал себя на мысли, что у меня возникла довольно продвинутая система предподготовки данных для работы с нейросетями. Я бы даже слегка выпендрился и сказал, что создаю свою нейросеть с «вручную управляемой» технологией RAG (Retrieval-Augmented Generation, в комментах подробнее).

Как устроена моя система хранения предподготовленых данных?

1. Папка с книгами по важным темам (с реальной книгой ИИ работает лучше, чем со своими «воспоминаниями» о ней). Плюс ссылки на реальные страницы

2. Папки с файлами с длинными промптами (удобнее, чем гонять между разными нейросетями, выискивая и копируя из одной в другую)

3. Специальный личный Тг-канал с промптами и находками, где темы = сообщения, а промпты и интересные находки = комменты (иначе не протолкнуться от длинных полотен)

4. (!) Папка с «цифровыми двойниками» людей, их контента и других полезностей, чтобы не искать и сразу давать полный контекст, если приспичит что-то спросить или поискать

* Файл со всеми постами моего основного канала
* Файл со всеми постами канала моей жены-психолога
* Файл со всеми постами канала моей дочери-кинопродюсера
* Файл про собаку дочери с кучей ветеринарной инфо
* Файл про меня рабочего, ещё один — про меня нерабочего
* Файл про то, как организован маркетинг у нас в компании
… и ещё две дюжины всякого

5. Папка с образцами удачных ответов нейросети по разными темам (чтобы быстро дать и сказать: «примерно так!»)

6. Ещё куча всего

Понимаете?

Когда мне надо решить какую-то задачу (например, дочка советуется по поводу того, какую работу выбрать) — у меня все готово для того, чтобы мгновенно скормить нейросети увесистый пакет данных и получить предельно точный ответ. И это прекрасно, потому что никакой промпт не даст такой точности (разве что в него всю эту информацию скопировать).

А когда я сталкиваюсь с полезным контентом (или получаю классный ответ) — я тут же закидываю его в соответствующую папку.

Я — продвинутый пользователь?

Эх, не зря, не зря Альтман сказал в том недавнем интервью, что молодежь, дескать, организует работу с нейросетью весьма навороченным образом:

«Они действительно используют его как операционную систему. Эм, у них есть сложные способы его настройки, чтобы подключать к куче файлов, и у них в голове или, знаете, где-то, куда они копируют и вставляют, запомнены довольно сложные промпты, и, эм, то, я думаю, все это круто и впечатляюще»

Хотя разве я молодежь?;) Но, впрочем, я уже писал, что корректнее было бы сказать: продвинутые и обычные пользователи нейросети.

А почему бы не хранить всё это внутри нейросети?

Потому что это влияет на контекст ответов. Читая ответ ЧатГПТ, который уже накопил кучу контекста по мне, я сталкиваюсь с предвзятыми ответами (в первую очередь, из файлов и книг, которые я загружал). Особенно если запускаю новый чат из папки проекта — там вообще кошмар. Просто новый чат — полегче, но все равно заметно, что он использует накопленные данные обо мне.

А заходя, к примеру, в Гемини, который контент не копит — я получаю «чистые» акценты. Менее предвзятые. Но для качественного ответа, очевидно, нужны исчерпывающие данные. Получается, собирая и структурируя данные для формирования конкретного запроса, я спасаюсь из тщательно формирующегося для меня пузыря. И заодно — никаких галлюцинаций!

Ну и попутно формирую цифровую копию моей жизни. Как и говорил Альтман.

А как у вас?

Какие папки, промпты и предзаготовленные данные у вас есть? Или вы этим не занимаетесь и просто промптите «с листа»? Пишите в комментариях и заполняйте опрос!

BY Лаборатория Промптинга Замышляева


Share with your friend now:
tgoop.com/PromptLab_Mozlab/173

View MORE
Open in Telegram


Telegram News

Date: |

5Telegram Channel avatar size/dimensions 2How to set up a Telegram channel? (A step-by-step tutorial) The initiatives announced by Perekopsky include monitoring the content in groups. According to the executive, posts identified as lacking context or as containing false information will be flagged as a potential source of disinformation. The content is then forwarded to Telegram's fact-checking channels for analysis and subsequent publication of verified information. The SUCK Channel on Telegram, with a message saying some content has been removed by the police. Photo: Telegram screenshot. SUCK Channel Telegram
from us


Telegram Лаборатория Промптинга Замышляева
FROM American