Telegram Web
⚡️ BigCodeBench: Большой бенчмарк для тестирование сгенерированного кода с использованием различных функций и сложных инструкций.

BigCodeBench бенчмарк, который содежит 139 библиотек и 7 доменов для решения 1140 сложных задач программирования".

abs: https://arxiv.org/abs/2406.15877
страница: https://bigcode-bench.github.io

@bigdatai
👍32🔥2
⚡️ Перевод экрана приложения на русский по двойному тапу

На Хабре появилась статья с простым способом настроить перевод экрана приложений на русский язык. Он работает на айфоне и поможет переводить экраны любых приложений с незнакомых языков на русский всего лишь по одному двойному тапу.

▪️ https://habr.com/ru/companies/yandex/posts/824706

@bigdatai
4👍1
💻 memgraph — графовая БД с открытым исходным кодом, предназначенная для динамических аналитических сред

curl https://install.memgraph.com | sh

Memgraph — это open-source БД, созданная для потоковой передачи данных в реальном времени и совместимая с Neo4j.
Memgraph особенно актуальна для тех, кто изучает взаимосвязанные данные, которые можно представить в виде графа

Memgraph может напрямую подключиться к потоковой инфраструктуре и может получать данные из таких источников, как Kafka, SQL или обычные CSV-файлы.

Memgraph реализована на C/C++ и использует архитектуру in-memory first, чтобы гарантировать постоянную максимальную производительность и отсутствие сюрпризов.
Соответствует требованиям ACID и обладает высокой доступностью.

🖥 GitHub
🟡 Доки

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥21
⚡️ Microsoft запустила новый курс по генеративному ИИ!

Бесплатный курс из 18 уроков доступен на Github и научит вас всему, что вам нужно знать, чтобы начать создавать приложения с генеративным ИИ

Github

@bigdatai
12👍5🔥3
⚡️ Scaling Synthetic Data Creation with 1,000,000,000 Persons

- Представлена коллекция из 1 миллиарда различных персонажей, автоматически отобранных на основе веб-данных
- Значительный прирост на MATH: 49,6 ->64,9

репозиторий: https://github.com/tencent-ailab/persona-hub
abs: https://arxiv.org/abs/2406.20094

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21
💻YugabyteDB — высокопроизводительная распределенная БД, которая поддерживает все возможности PostgreSQL

YugabyteDB отлично подходит для облачных OLTP-приложений (т. е. работающих в реальном времени и критически важных для бизнеса), которым необходима абсолютная корректность данных и требуется масштабируемость или высокая устойчивость к сбоям.

Быстрое создание локального кластера YugabyteDB с Docker:
docker run -d --name yugabyte -p7000:7000 -p9000:9000 -p15433:15433 -p5433:5433 -p9042:9042 \
yugabytedb/yugabyte:2.21.1.0-b271 bin/yugabyted start \
--background=false


🖥 GitHub
🟡 Доки

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍1
💻Вышла СУБД MySQL 9.0.0

На днях Oracle выпустила СУБД MySQL 9.0.0. Разработчики проекта подготовили и выложили в открытый доступ сборки MySQL Community Server 9.0.0 для основных дистрибутивов Linux, FreeBSD, macOS и Windows.

В 2023 году Oracle объявила об изменении модели формирования релизов СУБД MySQL. Разработчики начали выпускать два вида веток MySQL: Innovation (новые функции, частое обновление, три месяца поддержки) и LTS (с расширенным временем поддержки и сохранением неизменного поведения).

Проект MySQL 9.0 отнесён к ветке Innovation, к которым также будут отнесены следующие значительные релизы MySQL 9.1 и 9.2.

Дистрибутивы на базе Innovation-веток рекомендованы для тех пользователей, кто хочет раньше получать доступ к новой функциональности. Они публикуются каждые 3 месяца и поддерживаются только до публикации следующего значительного релиза (например, после появления ветки 9.1 будет прекращена поддержка ветки 9.0).

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥2
⚡️ Яндекс рассказал о принципах работы одного из крупнейших рекомендательных сервисов

«Баннерная крутилка» умеет переживать 700 тысяч RPS, а иногда и больше. При каждом запросе сервис просматривает базу из миллиарда документов и выбирает наиболее релевантные. Обработка запроса занимает менее 200 миллисекунд. Тем. кто строит рекомендательные системы, будет любопытно узнать, какими принципами руководствуется Яндекс при построении подобных высоконагруженных систем, как устроены стадии отбора документов и какое участие в ранжировании принимает ML.


https://habr.com/ru/companies/yandex/articles/816205/
3
🌟 MInference 1.0 — метод ускорения обработки промпта для LLM с большим контекстом

git clone https://huggingface.co/spaces/microsoft/MInference
cd MInference
pip install -r requirments.txt
pip install flash_attn pycuda==2023.1
python app.py


Вычислительные проблемы, связанные с выводом данных с помощью LLM, остаются большим препятствием для их широкого применения; вычислительная сложность растёт с увеличением длины подсказок.
Из-за квадратичной сложности вычислений для обработки промпта из 1 млн лексем на одном GPU A100 для 8B LLM требуется 30 минут.

Поэтому Microsoft выкатили MInference, которая позволяет ускорить обработку большого промпта до 10 раз, причём с сохранением точности LLM

🖥 GitHub
🤗 Демо на HF
🟡 Arxiv

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥53👍3
⚡️Лучший способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

C++ www.tgoop.com/cpluspluc
Devops: www.tgoop.com/devOPSitsec
Машинное обучение: www.tgoop.com/ai_machinelearning_big_data
АНАЛИЗ Данных: www.tgoop.com/data_analysis_ml
Хакинг: www.tgoop.com/linuxkalii
Linux: www.tgoop.com/linuxacademiya
Базы данных: www.tgoop.com/sqlhub
C#: www.tgoop.com/csharp_ci
Golang: www.tgoop.com/Golang_google
Java: www.tgoop.com/javatg
React: www.tgoop.com/react_tg
Javascript: www.tgoop.com/javascriptv
Мобильная разработка: www.tgoop.com/mobdevelop
Docker: www.tgoop.com/+0WdB4uvOwCY0Mjdi
Python: www.tgoop.com/pythonl
Rust: www.tgoop.com/rust_code
PHP: www.tgoop.com/phpshka
Android: www.tgoop.com/android_its
Big Data: www.tgoop.com/bigdatai
Собеседования МЛ: www.tgoop.com/machinelearning_interview
Python подготовка с собесу: www.tgoop.com/python_job_interview
МАТЕМАТИКА: www.tgoop.com/data_math

💼 Папка с вакансиями: www.tgoop.com/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: www.tgoop.com/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: www.tgoop.com/addlist/eEPya-HF6mkxMGIy
Папка ML: https://www.tgoop.com/addlist/2Ls-snqEeytkMDgy
C++ папка: https://www.tgoop.com/addlist/CdBs5DLepLJmZjY6
C# папка: https://www.tgoop.com/addlist/u15AMycxRMowZmRi
Java папка: https://www.tgoop.com/addlist/ZM3J6oFNAnRlNWU6
FRONTEND папка: https://www.tgoop.com/addlist/mzMMG3RPZhY2M2Iy
Linux папка: https://www.tgoop.com/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: www.tgoop.com/memes_prog
🇬🇧Английский: www.tgoop.com/english_forprogrammers
🧠ИИ: www.tgoop.com/vistehno

📕Ит-книги бесплатно: https://www.tgoop.com/addlist/BkskQciUW_FhNjEy
👍31
💻 WrenAI — open-source инструмент, который делает имеющуюся БД готовой к работе с RAG

curl -L https://github.com/Canner/WrenAI/releases/latest/download/wren-launcher-darwin.tar.gz | tar -xz && ./wren-launcher-darwin

WrenAI позволяет преобразовывать текст в SQL, изучать данные из БД без написания SQL, и делать многое другое

🖥 GitHub
🟡 Доки

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62👎1🔥1
⚡️ Как LeetCode, только по ML

В открытом доступе появился сборник задач по ML, затрагивающий темы линейной алгебры и deep learning.

Разработчики проекта поделили задачи по уровням сложности, а ещё там можно узнать правильный ответ и почитать подробнейший разбор каждой задачи.

🟡 Задачи по ML

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🔥43
2025/07/12 20:25:33
Back to Top
HTML Embed Code: