🔥 10 Python-библиотек, которые должен знать каждый AI Data Scientist в 2025Сохраняйте как шпаргалку — это полноценный роадмап библиотек, без которых сегодня не построить серьёзные AI/ML проекты.
1️⃣ LangChain — основа для LLM-агентов (reasoning, память, инструменты, API).
2️⃣ LangGraph — DAG + LangChain: условная логика, мультиагентные пайплайны.
3️⃣ Docling — извлечение данных из PDF, контрактов, отчётов.
4️⃣ OpenAI Python SDK — доступ к GPT-5, GPT-4o, DALL·E, Whisper и embeddings.
5️⃣ Markitdown — конвертация PDF/Word/Excel/HTML в Markdown.
6️⃣ Streamlit — быстрые AI-дашборды без фронтенда.
7️⃣ FastAPI — стандарт для продакшн-сервисов и AI-бэкендов.
8️⃣ ChromaDB — векторная БД для RAG-агентов и быстрого поиска.
9️⃣ FAISS — быстрый поиск по embedding'ам для семантического поиска и RAG.
🔟 AI Data Science Team — набор AI-агентов для типовых ML-задач (скоринг, анализ рисков).
📌 Эти библиотеки закрывают весь стек задач: от извлечения данных до построения RAG-систем и деплоя моделей.
Сохраняйте, чтобы не потерять!
🐸 Библиотека питониста#буст