Telegram Web
🐼 Pandas Fundamentals — бесплатный видеокурс по основам Pandas

Включает в себя:

▪️Series & DataFrames
▪️Фильтрация и индексы
▪️Функции для анализа данных
▪️Группировка и агрегация
▪️Объединение и конкатенация
▪️Работа с пропущенными данными

🔗 Ссылка на репо
✍️ Простой математический трюк, чтобы впечатлить окружающих

Попросите собеседника загадать любое целое число от 0 до 100 и поспорьте с ним, что отгадаете его не более чем за 7 попыток.

Знаете, как выиграть спор? Если нет, то открывайте спойлер👇

Секрет в использовании двоичного поиска — алгоритма, который сокращает диапазон чисел вдвое на каждом шаге. Вот как это работает:
1️⃣ Попросите собеседника уточнять, больше или меньше загаданное число относительно вашего предположения.
2️⃣ Начните с середины диапазона: 50 (среднее между 0 и 100).
3️⃣ В зависимости от ответа сужайте диапазон:
— Если число больше, ищите в верхней половине (от 51 до 100).
— Если меньше, переходите к нижней (от 0 до 49).
4️⃣ На каждом шаге выбирайте середину нового диапазона.
5️⃣ Максимум за 7 шагов вы точно угадаете число.

🪄 На самом деле за 7 шагов можно угадать любое число от 0 до 127 или от 1 до 128. Всё потому, что два в седьмой степени — это как раз 128. Так, за 8 попыток можно угадывать числа до 256, за 9 попыток — 512 и так далее.
🔗 DataChain — фреймворк для управления данными

Ключевые особенности фреймворка:

📂 Мультимодальная версионность данных
🔘Версионирование неструктурированных данных без перемещения или копирования, с поддержкой ссылок на хранилища S3, GCP, Azure и локальные файловые системы.
🔘Поддержка мультимодальных данных: изображения, видео, текст, PDF, JSON, CSV, Parquet и др.
🔘Объединение файлов и метаданных в постоянные, версионные наборы данных.

🐍 Python-friendly
🔘Работа с объектами Python и их полями: числовые значения, строки, матрицы, ответы LLM.
🔘Обработка больших наборов данных (до терабайтов) с встроенной параллелизацией и экономным использованием памяти — без необходимости SQL или Spark.

🧠 Обработка данных
🔘Генерация метаданных с использованием локальных AI-моделей и LLM API.
🔘Фильтрация, объединение и группировка наборов данных по метаданным. Поиск по векторным эмбеддингам.
🔘Высокопроизводительные векторизированные операции на Python-объектах: суммирование, подсчёт, вычисление среднего и др.
🔘Передача наборов данных в Pytorch и Tensorflow или экспорт обратно в хранилище.
Please open Telegram to view this post
VIEW IN TELEGRAM
2024/12/23 16:28:20
Back to Top
HTML Embed Code: