Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение 6019

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Как провести выходные с пользой? Вместо сериалов попробуйте сайт Datalemur

Здесь собраны задачи по SQL, статистике, машинному обучению и Python, которые часто встречаются на интервью в крупных IT-компаниях.

🐒 Задачи по SQL, чтобы найти, сколько бананов съели лемуры.
🤖 Кейсы по машинному обучению для прогнозирования количества чашек кофе до дедлайна.
📊 Уравнения по статистике, чтобы понять, хватит ли одной пиццы на всю команду.

Платформа помогает прокачать навыки и подготовиться к интервью.

☕ Чтобы начать, заварите чай, зайдите на сайт, выберите категорию задач и погружайтесь в мир аналитики. Это отличный способ провести время с пользой, даже если не планируете менять работу.

#АналитикаДанных #FAANG #Интервью #Задачи

❤6👍4

2.22K views18:01

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🧹 Cleanlab — инструмент, который поможет очистить данные

📊 Этот пакет отлично работает с реальными «грязными» данными. Cleanlab использует существующие модели, чтобы находить и исправлять ошибки в данных, позволяя обучать ещё более точные и надёжные модели.

Проект

#ЧисткаДанных

👍5❤1🤩1

2.12K views07:07

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Proglib.academy | IT-курсы

📊 Что такое большие данные, как их классифицируют и какими характеристиками обладают

Рассказываем об основных терминах, методах и инструментах, которые используются при анализе больших данных.

🔗 Читать статью

🔵 А чтобы еще больше погрузиться в Big Data, забирайте наш курс «Базовые модели ML и приложения»

Please open Telegram to view this post

VIEW IN TELEGRAM

1.54K views18:12

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

This media is not supported in your browser

VIEW IN TELEGRAM

🎨 Создавайте датасеты за секунды прямо в Jupyter

Представляем библиотеку Python — drawdata, которая позволяет визуализировать и создавать датасеты буквально за три строки кода.

📊 Это невероятно полезный инструмент для разработчиков, работающих с данными.

Пример:

python from drawdata import ScatterWidget widget = ScatterWidget() widget

✨ Библиотеку создал и поддерживает Vincent D. Warmerdam, автор множества других полезных инструментов.

🌟 Ознакомьтесь с репозиторием и поставьте звезду: github

#Python #DataScience #Jupyter #ВизуализацияДанных #Разработка

🔥12👍4❤1

2.34K viewsedited 07:06

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🌍 50 ведущих экспертов ИИ 2025 года

⚡ От ИИ и машинного обучения до устойчивого развития — эти эксперты делают цифровую трансформацию доступной для всех. В этом списке нет крупных корпораций, только настоящие лидеры мнений и создатели контента.

Список

👀 А вы уже следите за кем-то из этого списка? Поделитесь!

#ИскусственныйИнтеллект #БудущееТехнологий

👍2🔥1

1.94K views18:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

8 курсов от NVIDIA, которые стоит изучить

Generative AI Explained
🔹 Как работает генеративный ИИ
🔹 Применения и проблемы генеративного ИИ

AI for All: From Basics to GenAI Practice
🔹 Влияние ИИ на здравоохранение и автономные системы
🔹 Применение генеративного ИИ

Getting Started with AI
🔹 Сбор и разметка данных для моделей классификации
🔹 Обучение нейронной сети

Building A Brain in 10 Minutes
🔹 Как нейросети обучаются на данных
🔹 Математика нейронов в простых примерах

Building Video AI Applications
🔹 Создание видеопотоков с помощью DeepStream
🔹 Обработка нескольких потоков видео

Building RAG Agents with LLMs
🔹 Масштабируемое развертывание LLM
🔹 Использование LangChain для управления диалогами

Accelerate Data Science Workflows with Zero Code Changes
🔹 Ускорение обработки данных с помощью GPU
🔹 Преимущества унифицированных CPU и GPU потоков

Introduction to AI in the Data Center
🔹 Основы ИИ и архитектура GPU
🔹 Развертывание AI-инфраструктуры
🔹 AI-кластеры

❤6👍1

2.3K views06:30

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

✅ DeepSeek представляет новую открытую модель DeepSeek-R1

DeepSeek выпустили модель DeepSeek-R1, которая способна конкурировать с OpenAI-o1 в задачах математики, программирования и рассуждений. Модель распространяется под лицензией MIT, что позволяет свободно модифицировать, использовать и коммерциализировать.

😊 Меньшие версии модели превосходят GPT-4o и Claude-3.5-Sonnet в отдельных бенчмарках.
📊 Результаты API теперь можно использовать для fine-tuning и дистилляции.
💰 Доступны конкурентные цены на использование API.

Подробности
📈 DeepSeek-R1 достигает 97,3% на MATH-500 и 79,8% на AIME 2024.
🤖 Модель обучена с использованием многоступенчатого подхода: RLHF (обучение с подкреплением) и supervised дообучение.
🛠️ Доступны шесть версий модели — от 1,5B до 70B параметров для разных задач.

Ссылка

🔥4❤2👍2

2.09K viewsedited 11:02

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

✌️ Открытая редакция: ищем авторов для рубрики DevLife

Друзья, нас часто спрашивают про публикацию материалов о личном опыте и знаниях в IT. Пора это систематизировать!

Если у вас есть история о том, как вы:
📈 выросли в профессии
💡 освоили новые технологии
🚀 сделали крутой карьерный скачок
🤯 эпично лажанулись
🛠 создали интересные проекты

— присылайте свои статьи на почту [email protected] с темой DevLife.

Требования простые:
🧑‍💻 Реальный опыт
🛤 Конкретные шаги
✍️ От 5000 знаков
📄 Ссылка на Google Docs

🔥 Лучшие истории опубликуем на сайте и в наших соцсетях с общим охватом 1 млн+ человек. Ждем ваши истории!

👍2😁1

1.93K viewsedited 15:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека задач по Data Science | тесты, код, задания

👍1

1.98K views18:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека задач по Data Science | тесты, код, задания

Что выведет код?

Anonymous Quiz

594 voters2K views18:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

This media is not supported in your browser

VIEW IN TELEGRAM

Нельзя не согласиться 😂

😁16💯4❤1

2.08K viewsedited 07:15

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🚀 Дональд Трамп анонсировал создание компании Stargate

💰 Инвестиции
- $500 миллиардов за 4 года на инфраструктуру ИИ для OpenAI в США.
- $100 миллиардов сразу.

🤝 Основные акционеры и партнеры
- Инвесторы: SoftBank, OpenAI, Oracle, MGX.
- Руководство: SoftBank (финансовая ответственность), OpenAI (операционная ответственность).

💻 Технологические партнеры
- Arm, Microsoft, NVIDIA, Oracle, OpenAI.

🔗 Сотрудничество
- OpenAI, Oracle и NVIDIA создадут вычислительную систему.
- Сотрудничество с Microsoft и Azure.

Источник

❤4🔥2😁1

2.23K views18:02

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🌟 15 табличных операций: Pandas ↔️ SQL ↔️ Polars ↔️ PySpark

Визуал, который показывает, как выполняются самые распространенные табличные операции в Pandas и их аналоги в SQL, Polars и PySpark.

#Pandas #SQL #Polars #PySpark

🔥11👍2

2.3K views07:05

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

🎯 Понимание T-теста

T-тест — это статистический метод для проверки гипотез, анализа значимости признаков и сравнения моделей машинного обучения.

Типы T-тестов
1️⃣ Одновыборочный:
Сравнивает среднее значение одного набора данных с известным средним значением в популяции.
Пример использования: Проверка, отличается ли средняя метрика производительности модели от заданного базового значения (baseline).

2️⃣ Независимый (двухвыборочный):
Сравнивает средние значения двух независимых групп, чтобы определить, есть ли статистически значимые различия.
Пример использования: Сравнение результатов двух разных моделей или методов предобработки данных.

3️⃣ Парный:
Сравнивает средние значения двух зависимых групп.
Пример использования: Оценка влияния изменений в модели, например, после настройки гиперпараметров или добавления новых признаков.

Ограничения
⚠️ Чувствителен к выбросам, которые могут исказить результаты.
⚠️ Требует предположения о нормальности распределения данных (если выборки малы).

👍5❤1🔥1🌚1

2.12K views11:00

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека задач по Data Science | тесты, код, задания

👍2

1.82K views18:46

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

Forwarded from Библиотека задач по Data Science | тесты, код, задания

Что выведет код?

Anonymous Quiz

😁3

529 voters1.87K views18:46

Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение

💡 Как получить от нейросети код, работающий в 100 раз быстрее

Интересный эксперимент провели с Claude 3.5 Sonnet: попытались улучшить простой алгоритм на Python, раз за разом прося ИИ «написать код лучше». Задача была несложная — найти разницу между максимальным и минимальным числами в массиве, сумма цифр которых равна 30.

Казалось бы, что тут можно улучшать?
👉 Подробнее в нашей статье

#CodeOptimization

❤3

13.9K views07:06

2025/07/09 18:48:20
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>