tgoop.com/contentreviewai/50
Last Update:
Пока писали пост про генерацию подкастов, столкнулись со странной особенностью текстов про NotebookLM от Гугла — люди часто воспринимают его либо просто как сервис для генерации подкастов, либо как «умные заметки» для студентов типа Notion. Сегодня хотим написать, почему считаем его чем-то большим — фактически, полноценной кастомизируемой RAG системой для пользователей и одним из самых полезных сервисов для работы с информацией.
Сначала пару слов про то, что такое RAG (Retrieval Augmented Generation). Это специальный метод работы с большими языковыми моделями, где пользователи не просто задают вопрос (надеясь, что нужная информация попадалась модели во время тренировки) — а снабжают модель всем необходимым контекстом. По такому принципу работает, например, Нейро от Яндекса — сначала модель получает запрос, потом идёт с ним в поиск, собирает актуальную информацию с веб-страниц и уже на основе этой информации, со ссылками и контекстом даёт ответ пользователю.
У такого подхода очень много плюсов, потому что он позволяет избежать донастройки модели, легко обновлять базу данных новыми сведениями и в целом дешевле и проще в использовании. Но из описания понятно, что самый главный его плюс — возможность свести к минимуму «галлюцинации» модели (это когда она не знает ответ и начинает его самозабвенно на ходу придумывать).
Так вот NotebookLM — это сервис, который позволяет вам загрузить до 50 самых разных источников (сайты, документы, аудио, видео), сформировав тот самый контекст для работы нейросети. Каждый источник может содержать до 500000 слов (то есть примерно 1000 стандартных книжных страниц). Сервис будет «понимать» содержание всех источников, вплоть до ссылок на конкретные строчки конкретных документов, что позволит легко проверить результаты работы нейросети. При этом в основе сервиса одна из лучших мультимодальных моделей Гугла — Gemini 2.0 — которая легко понимает ваши запросы. Понятно, что Гугл предупреждают: «Ответы NotebookLM могут быть неточны. Обязательно проверяйте их» — но пока это всё равно самый надёжный способ работы с ИИ.
В итоге полностью меняется подход работы с данными — больше не нужно самостоятельно изучать, например, API какого-нибудь сервиса, 7 томов исследований или 10 часов лекций. Достаточно загрузить их сюда, задать вопросы о деталях документов, сказать найти неточности или странные аномалии в данных, попросить предложить темы и структуру эссе или статей, которые могут на этих источниках основываться — и тем самым посмотреть на объект изучения с разных сторон. В данном случае функционал платформы не ограничен просто кратким пересказом, чем сегодня практически невозможно удивить пользователя.
При этом каждый ответ нейросети сопровождается ссылкой на конкретную цитату из источника — то есть можно пройти и проверить, не придумала ли вдруг она что-то лишнее.
Ну и самое удивительное, что сервис отлично работает на русском языке (кроме генерации подкастов) и пока что полностью бесплатный. Полноценных аналогов у него нет, ну или мы не нашли, хотя есть многообещающие конкуренты вроде NotebookLlama или более простые альтернативы, такие как ChatPDF, боты ChatGPT и Perplexity, которые тоже позволяют загрузить файл и задать вопросы по его содержанию.
BY CR AI
Share with your friend now:
tgoop.com/contentreviewai/50