Data Science. SQL hub 1476 - Telegram Web

Data Science. SQL hub

💻

Kvrocks — распределенная БД NoSQL, использующая RocksDB в качестве механизма хранения и совместимая с протоколом Redis

Apache Kvrocks — это распределенная key-value БД, которую можно использовать вместо Redis.
Дизайн репликации и хранения был вдохновлен rocksplicator и blackwidow.

Особенности Kvrocks:

— Совместимость с Redis: можно получить доступ к Apache Kvrocks через любой клиент Redis.

— Пространство имен: аналогично Redis SELECT, но с токеном для каждого пространства имен.

— асинхронная репликация с использованием binlog, как в MySQL.

— поддержка Redis sentinel для аварийного переключения при сбое ведущего или ведомого устройства.

Быстрый старт с Docker:

docker run -it -p 6666:6666 apache/kvrocks --bind 0.0.0.0

🖥

🟡

Доки

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍3🔥3

4.63K views10:03

Data Science. SQL hub

🖥

Scientific Computing with Python — это бесплатный интерактивный курс от FreeCodeCamp, созданный для изучения анализа данных с помощью Python.

Основные темы включают:

▪️ работу со строками;
▪️ List Comprehension;
▪️ основы алгоритмического дизайна;
▪️ структуры данных;
▪️ классы и объекты.

Цель курса — дать учащимся прочные навыки для работы с научными данными и их обработкой, используя Python.

🔗 Ссылка на курс

#курс #python

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11🔥5👍3

4.17K views10:03

Data Science. SQL hub

💻

Debezium — open-source CDC для Apache Kafka

Debezium — это CDC (Capture Data Change), набор коннекторов для различных СУБД, совместимых с фреймворком Apache Kafka Connect.

Debezium поддерживает следующие СУБД: MySQL, PostgreSQL, MongoDB, SQL Server, Cassandra и Oracle;
причём все эти СУБД подключаются по единой общей модели.

Если сравнивать использование Debezium с традиционным подходом (когда приложение читает данные из СУБД напрямую), то к его главным преимуществам относится реализация стриминга изменения данных на уровне строк с низкой задержкой, плюс высокая надежность и доступность.

🖥

🟡

Доки

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍4🔥3

4.33K views10:03

Data Science. SQL hub

🖥

Neon

Neon - это бессерверная альтернатива AWS Aurora Postgres с открытым исходным кодом, написанная на Rust.

В инструменте поддерживается автомасштабирование, разделяет хранение и вычисления , перераспределяя данные по кластеру узлов.

🖥

Github

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍3🔥3

4.22K viewsedited 13:37

Data Science. SQL hub

⚒️ Шардирование базы данных: шпаргалка для разработчика

👉 Источник

👍10❤6🔥2

4.9K views16:04

Data Science. SQL hub

💻

GreptimeDB — облачная распределенная БД временных рядов с открытым исходным кодом; поддерживает PromQL/SQL/Python

GreptimeDB — это open-sorce БД временных рядов, ориентированная на эффективность, масштабируемость и аналитические возможности.

Особенности GreptimeDB:
— оптимизированная колоночная структура для работы с данными временных рядов; сжатие и хранение в различных системах хранения данных, в частности в облачных объектных хранилищах

— полностью открытая архитектура распределенного кластера, использующая мощь облачных вычислительных ресурсов

— встроенный SQL и PromQL для запросов, возможность использовать сценарии Python для решения сложных аналитических задач

Быстрый старт с Docker:
docker run --rm --name greptime --net=host grepwww.tgoop.com/greptimedb standalone start

🖥

🟡

Доки

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥1

5.05K views20:17

Data Science. SQL hub

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

SQLFlow - отличный инструмент для визуализации SQL-запросов

Легкий и простой интрумент для визуализация связей и структур БД, поддерживающий более 20 разных БД.

▪DEMO
▪GitHub

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18🔥8❤7

5.93K views10:04

Data Science. SQL hub

Если вы работаете в области данных, вам предстоит пройти собеседование по SQL

Вот несколько кратких советов которые вы должны знать на собеседовании по SQL.

Начинающим
- Уметь объяснить различные типы объединений. Иногда я видел, что этот вопрос задается рекрутерами в качестве отборочного, чтобы убедиться, что они хотят взять вас на работу.
- Знать, когда в порядке выполнения операций в SQL используется HAVING, а когда WHERE.

Mid
- Понимать, как использовать оператор CASE внутри функции SUM или COUNT
- Знать, по крайней мере, 1-2 способа оптимизации запроса, и если вы решите, что одним из этих способов является создание индекса в таблице, то вы должны знать, какие плюсы и минусы есть у индекса.

Продвинутым
- Знать, как решить SQL задачу с использованием оконной функции и без нее.
- Понимать и уметь объяснить, что такое коррелированный подзапрос.
- Просто сошлитесь на то, что вы посмотрите на план выполнения запроса. Рекрутеры будут шокированы тем, что вы вообще знаете, что это такое.

@sqlhub

❤19👍10🔥2

6.44K views15:13

Data Science. SQL hub

💻

Valkey — это высокопроизводительное open-source хранилище данных, поддерживающее кэширование, очереди сообщений; может выступать в качестве основной базы данных

Также Valkey может работать как автономная фоновая служба или в кластере, с возможностью репликации и высокой доступности.

Valkey поддерживает множество типов данных, включая строки, числа, хэши, списки, наборы, сортированные наборы, растровые изображения и др.
Можно оперировать со структурами данных с помощью набора команд. Valkey также поддерживает встроенную поддержку сценариев на языке Lua и поддерживает модули-плагины для создания новых команд и типов данных.

🖥

🟡

Доки

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤5🔥5👏1

6.39K views16:04

Data Science. SQL hub

✔️

Туториал: Использование PostgreSQL в качестве векторной базы данных для RAG.

В туториале показан пошаговый сценарий к созданию векторной базы данных в PostgreSQL для хранения фрагментов текста из нескольких статей Википедии. В нем описывается процесс встраивания фрагментов текста и их сохранения в базе данных вместе с соответствующим заголовком, текстом и URL-адресом статьи.

Также приведен пример, как использовать векторное сходство для поиска релевантного контекста из базы данных с учетом запроса пользователя. Как извлеченный контекст используется для дополнения исходного запроса, прежде чем он будет передан в LLM для создания окончательного инференса.
infoworld.com

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7🔥4👍3

5.8K views13:03

Data Science. SQL hub

🖥

Крутая шпаргалка по SQL.

В ней, предоставлены основные примеры запросов, а также пояснения к ним на русском языке.

Сохраняйте, чтобы не потерять

#шпаргалка #sql

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥25👍12❤4🤯1

6.1K views10:04

Data Science. SQL hub

Тоже так считаете ?)

@sqlhub

🔥26👍15😁11❤3👎3

5.15K views10:26

Data Science. SQL hub

💻

eralchemy — простой инструмент на Python для отрисовки взаимоотношений таблиц SQ

— pip install eralchemy

eralchemy — это генератор диаграмм для баз данных а также для различных объектов SQLAlchemy.
eralchemy работает с SQLAlchemy < 1.4, а также с версиями выше 1.4.

🖥

GitHub

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍6🔥5

5.8K views16:21

Data Science. SQL hub

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Интерактивная схема устройства работы векторных баз данных

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

❤11👍5

5.12K views08:02

Data Science. SQL hub

7️⃣самых эффективных стратегий для масштабирования БД

🔵

Материализованные представления: Предварительно рассчитывайте результаты сложных запросов и сохраняйте их для быстрого доступа.

🔵

Денормализация: Упрощайте сложные соединения для повышения скорости выполнения запросов.

🔵

Вертикальное масштабирование: Увеличивайте ресурсы сервера (процессоры, оперативную память, хранилище) для улучшения производительности.

🔵

Индексация: Анализируйте запросы вашего приложения и создавайте подходящие индексы для ускорения работы.

🔵

Кэширование: Храните часто запрашиваемые данные в быстром хранилище, чтобы снизить нагрузку на базу данных.

🔵

Репликация: Создавайте копии основной базы данных на разных серверах для увеличения объема операций чтения.

🔵

Шардинг: Разделяйте таблицы на более мелкие части и распределяйте их по серверам для улучшения работы с записью и чтением.

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9❤5👍3

5.92K views15:04

Data Science. SQL hub

🖥

SQL для Data Science: ключевые вопросы с собеседований по разным уровням

Подборка важных SQL вопросов для разных уровней👇

🔹 Начинающие (0-2 года):
▪️ В чем разница между WHERE и HAVING?
▪️ Какие виды JOIN существуют в SQL?

🔹 Опытные (2-5 лет):
▪️ Запрос для поиска второй по величине зарплаты.
▪️ Оконные функции в SQL, пример с ROW_NUMBER().

🔹 Эксперты (5+ лет):
▪️ Как оптимизировать медленный запрос?
▪️ Когда использовать кластеризованные и некластеризованные индексы?

🖥

Ссылка

@sqlhub

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7❤4👍3

6.59K views15:05

2025/07/13 08:34:52
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>