Big Data AI

🌟

Whisper WebGPU — распознавание речи локально, при помощи Whisper

git clone https://github.com/xenova/whisper-web.git
cd whisper-web
npm install

npm run dev

# http://localhost:5173/

Whisper WebGPU — очень быстрое распознавание речи локально прямо в браузере, поддерживает 100 языков

🖥

GitHub

🟡

Затестить Whisper WebGPU

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤1🔥1

2.29K viewsedited 10:36

Big Data AI

🌟

DuckDuckGo представила собственный ИИ-чат

Разработчики DuckDuckGo представили собственный бесплатный ИИ-чат. Сейчас пользователям доступны четыре модели машинного обучения, но в будущем список планируют расширить.

Доступ к чат-боту от DuckDuckGo можно получить несколькими способами:

— на портале DuckAI duck.ai;

— на специальной странице чата — duckduckgo.com/chat;

— в поисковой выдаче;

— с помощью bangs !ai и !chat в адресной строке.

На выбор пользователям доступно четыре языковые модели: GPT 3.5 Turbo, Claude 3 Haiku, Llama 3 и Mixtral 8x7B. Запросы к ним можно отправлять бесплатно, но с ограничением по количеству запросов в сутки. Пока нет возможности получить безлимитный доступ, но представители компании отметили, что уже думают над платным тарифом и расширенным списком языковых моделей.

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥4❤1

2.25K views16:08

Big Data AI

top CVPR 2024 papers

Конференция по компьютерному зрению и распознаванию образов CVPR 2024 - это масштабная конференция.

Только в 2024 году было представлено 11 532 доклада, из которых 2 719 были приняты.

Вот репозиторий, чтобы помочь вам найти лучшие публикации CVPR.

▪Github

@bigdatai

🔥2👍1

2.2K views16:42

Big Data AI

⭐️ Яндекс выложил в опенсорс свою библиотеку YaFSDP

Это библиотека для обучения больших языковых моделей с открытым исходным кодом, которая позволяет ускорить их обучение до 25%, а также тратить до 20% меньше ресурсов графических процессоров.

Использование библиотеки даёт существенный выигрыш в производительности и потреблении памяти: YaFSDP позволяет использовать ровно столько памяти процессоров, сколько необходимо, а коммуникацию между GPU в сети при этом ничего не тормозит.

https://habr.com/ru/companies/yandex/articles/817509/

@bigdatai

👍4🔥3🥰1

2.48K views18:04

Big Data AI

🏴‍☠️

Представляем новый открытый набор данных "Character Codex"!

Он содержит данные о 15 939 персонажах из самых разных источников, от аниме до исторических личностей, ученых и популярных персонажей, как вымышленных, так и не вымышленных!

Скачать на HuggingFace: https://huggingface.co/datasets/NousResearch/CharacterCodex

Потенциальные варианты использования - это использование для генерации синтетических данных, анализа данных о ролевых играх и многого другого.

https://huggingface.co/datasets/NousResearch/CharacterCodex

#датасет

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4❤2👍2

2.5K viewsedited 21:30

Big Data AI

⚡️ Вышла версия Ollama v0.1.43!

Эта версия улучшает работу с Llama.

Исправлно множество ошибок!

* Github

@bigdatai

❤1👍1🔥1😁1

2.35K viewsedited 14:58

Big Data AI

Вышел Stable Diffusion 3 - самый мощный бесплатный генератор картинок!
https://youtu.be/k3QNJBpDe7o

@bigdatai

YouTube

Вышел Stable Diffusion 3 - самый мощный бесплатный генератор картинок!

⚡️ Встречайте Stable Diffusion 3!

⚡️https://www.tgoop.com/ai_machinelearning_big_data - наш канал, для всех, кто любит машинное обучение и data science
⚡️https://www.tgoop.com/+ANhw-uaOaYs1Mjky - это база с 1900 вопросами с собеседований по анализу данных, машинному обучению…

👍2🔥1😁1

2.46K viewsedited 19:54

Big Data AI

⚡️ Recap-DataComp-1B - это крупномасштабный набор графических и текстовых данных, который был восстановлен с использованием усовершенствованной модели LLaVA-1.5-LLaMA3-8B для повышения согласованности и детализации текстовых описаний.

▪data: https://huggingface.co/datasets/UCSC-VLAA/Recap-DataComp-1B
▪proj: https://haqtu.me/Recap-Datacomp-1B/
▪abs: https://arxiv.org/abs/2406.08478

@bigdatai

❤2🔥2👍1

2.42K views10:47

Big Data AI

⚡️ Open VLA: Vision-Language модель с открытым исходным кодом

статья: https://arxiv.org/abs/2406.09246
страница проекта: https://openvla.github.io
код: https://github.com/openvla/openvla

Open VIA, модель открытым исходным кодом с параметрами 7B, отлаженную в Llama-2 в сочетании с визуальным кодером, который объединяет предварительно подготовленные функции из DINOv2 и SigLIP.

Она обучена на 970 тысячах эпизодов с роботами из открытого набора данных X-Embodion.

Модель превосходит 55B-param RT-2-X с закрытым исходным кодом на 16,5% по абсолютному показателю успешности выполнения задач в 29 задачах и нескольких вариантах робота, при этом его параметры в 7 раз меньше.

@bigdatai

🔥2❤1👍1

2.41K viewsedited 08:10

Big Data AI

💻

SirixDB — это open-source гибридная система баз данных, ориентированная на работу с дисками и памятью

SirixDB имеет облегченный буфер-менеджер, способный хранить ссылки на страницы in-memory.
SirixDB представляет собой структурированное хранилище временных документов и хранит истории всех ресурсов в компактной форме.
Процессор запросов поддерживает сложные запросы, связанные с разными временными диапазонами.

🖥

GitHub

🟡

Доки

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤1

2.5K views13:32

Big Data AI

🔥 CinePile - это набор данных для понимания видео, основанный на вопросах и ответах. Он был создан с использованием передовых моделей большого языка (LLM). Он состоит примерно из 300 000 точек данных для обучения и 5000 точек данных для тестирования. 300 тысяч обучающих и 5 тысяч тестовых фрагментов. A

📃 : https://arxiv.org/abs/2405.08813
🤗 : https://huggingface.co/datasets/tomg-group-umd/cinepile

❤1👍1🔥1

2.55K views15:01

Big Data AI

1:38

This media is not supported in your browser

VIEW IN TELEGRAM

🍏

4M: Massively Multimodal Masked Modeling

Apple релизнули модель 4M-21.

Это довольно эффективная мультимодальная модель, которая решает десятки задач и работет для разных модальностей.

Применение многозадачного обучения в мультимодальных моделях действительно продвинулось на шаг вперед. Мы можем обучить одну модель множеству разнообразных задач с высокой точностью.

🌐 https://4m.epfl.ch
⌨️ https://github.com/apple/ml-4m/

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2💩2❤1🔥1

2.66K views14:24

Big Data AI

MIT 6.S191: (Google) Generative AI for Media

https://www.youtube.com/watch?v=P7Hkh2zOGQ0

@bigdatai

YouTube

MIT 6.S191 (2024): Google - Generative AI for Media

MIT Introduction to Deep Learning 6.S191: Lecture 7
Generative AI for Media
Lecturer: Doug Eck (Google)

Douglas Eck is a Senior Research Director at Google, and leads research efforts at Google DeepMind in Generative Media, including image, video, 3D, music…

👍3🔥1

2.74K views15:37

Big Data AI

⚡️ gui-world: Набор данных ориентированных на работу с GUI интерфейс мультимодальных агентов на базе LLM

Набор данных из 12 тысяч высококачественных разнообразных GUI.

▪proj: https://gui-world.github.io
▪abs: https://arxiv.org/abs/2406.10819

@bigdatai

👍4🔥2❤1

2.53K views17:46

Big Data AI

⚡️ Microsoft только что выпустили модель Florence

Модель уровня с параметрами SOTA 200M и 800M ! 🔥

> Лицензия MIT! 🤯
> Модель, которая превосходит Flamingo 80B (модель в 400 раз больше) с огромным отрывом
> Ссоздание субтитров, распознавание объектов и сегментацию, распознавание текста, расшифровку фраз и многое другое
> Набор данных FLD-5B - 5,4 миллиарда аннотаций на 126 миллионах изображений
> Многозадачное обучение
> > Точно настроенные модели, которые превосходят такие, как PaLI, PaLI-X

https://huggingface.co/collections/microsoft/florence-6669f44df0d87d9c3bfb76de

@bigdatai

👍3❤1🔥1

2.49K views12:07

Big Data AI

🔥 From Pixels to Prose: A Large Dataset of Dense Image Captions

Pixel Prose содержит более 16 миллионов разнообразных изображений, полученных из трех различных веб-баз данных (commonPool, CC12M, RedCaps), с подписями, созданными с помощью Google Gemini 1.0 Pro Vision.

▪abs: https://arxiv.org/abs/2406.10328
▪датасет: https://huggingface.co/datasets/tomg-group-umd/pixelprose

@bigdatai

❤1👍1🔥1

2.64K views19:28

Big Data AI

💻

MatrixOne — гиперконвергентная облачная open-source БД

wget https://raw.githubusercontent.com/matrixorigin/mo_ctl_standalone/main/install.sh && sudo -u $(whoami) bash +x ./install.sh

mo_ctl set_conf MO_PATH="yourpath" # Set custom MatrixOne download path
mo_ctl set_conf MO_DEPLOY_MODE=git # Set MatrixOne deployment method

MatrixOne — это гиперконвергентная облачная распределенная БД со структурой, которая разделяет хранение, вычисления и транзакции, образуя единый движок данных HSTAP.
Этот механизм позволяет единой системе баз данных справляться с различными бизнес-нагрузками, такими как OLTP, OLAP и потоковые вычисления.

MatrixOne поддерживает развертывание и использование в публичных и частных облаках, обеспечивая совместимость с различными инфраструктурами.

🖥

GitHub

🟡

Доки

@bigdatai

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1🔥1

2.8K views09:33

Big Data AI

NVIDIA’s AI: Virtual Worlds, Now 10,000x Faster!

https://www.youtube.com/watch?v=g5Vo2EiEFnA

@bigdatai

YouTube

NVIDIA’s AI: Virtual Worlds, Now 10,000x Faster!

❤️ Check out Microsoft Azure AI and try it out for free:
https://azure.microsoft.com/en-us/solutions/ai

📝 The paper "Factory: Fast Contact for Robotic Assembly" is available here:
https://sites.google.com/nvidia.com/factory/

📝 My paper on simulations that…

👍2❤1🔥1

3.1K views18:05

2025/07/12 15:52:29
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>