Машинное обучение RU 2288

🔥

"your-source-to-prompt.html" — инструмент, который позволяет превращать исходный код проектов в текстовые запросы для LLM, используя только ваш локальный компьютер!

🌟 Все операции выполняются в браузере, без необходимости установки дополнительных зависимостей. Это решение ориентировано на безопасность (код не покидает устройство) и удобство работы с любыми папками и репозиториями. Оно поддерживает создание предустановок для повторяющихся задач и может минимизировать код для экономии места в контексте модели.

🖥

Github

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤2

2.22K views11:29

Машинное обучение RU

🔥 Новая эра разработки ИИ от NVIDIA

NVIDIA удивила новым решением для обучения ИИ-моделей прямо дома! Представлен компактный одноплатный компьютер Jetson Orin Nano Super. Инженеры компании смогли не просто увеличить производительность устройства на 70%, но и уменьшить его стоимость вдвое по сравнению с предыдущей моделью.

Основу новинки составляет шестиядерный процессор Arm Cortex-A78AE, работающий на частоте 1,7 ГГц. Вместе с графическим процессором, который функционирует на частоте 1020 МГц и оснащен 1024 ядрами CUDA и 32 тензорными ядрами, система обеспечивает производительность до 67 TOPS.

Устройство отличается высокой совместимостью благодаря четырем портам USB 3.2 Type-A, двум интерфейсам MIPI CSI для подключения камер и разъемам M.2 для SSD-накопителей. Питание компьютера возможно как через USB Type-C, так и через специальный разъем, при этом максимальная мощность потребления составляет всего 25 Вт.

На практике Jetson Orin Nano Super значительно ускоряет выполнение различных задач: обучение языковых моделей становится быстрее на 37–63%, машинное зрение улучшается на 36–104%, а скорость распознавания изображений возрастает на 43–69%.

Продажи начнутся до конца декабря, цена составит 250 долларов (около 26 000 рублей). Так что самое время задуматься о создании своего домашнего робота!

https://www.nvidia.com/en-us/autonomous-machines/embedded-systems/jetson-orin/nano-super-developer-kit/

@machinelearning_ru

🔥8👍4❤2👏1

3.09K views11:30

Машинное обучение RU

Forwarded from Machinelearning

🌟 Bamba-9B: эффективная Hybrid Mamba2 модель.

Bamba-9B - модель, разработанная IBM, Princeton, CMU и UIUC на основе полностью открытых данных. Модель демонстрирует улучшение пропускной способности в 2.5 раза и снижение задержки инференса в 2 раза по сравнению с Transformers в vLLM. Bamba-9B доступна для использования в HF Transformers, vLLM, TRL и llama.cpp.

Bamba-9B использует уникальный распределенный, не сохраняющий состояние data loader, обеспечивающий бесшовное возобновление работы, автоматическое масштабирование, потоковую передачу данных с zero-overhead for shuffling.

Модель основана на архитектуре NVIDIA hybrid Mamba2, но с некоторыми изменениями. Bamba-9B имеет 32 слоя, из которых 3 полноценных слоя внимания и 29 слоев Mamba2, в то время как NVIDIA hybrid Mamba2 имеет 29 слоев, из которых 4 слоя внимания и 25 слоев Mamba2.

Bamba-9B была обучена на 2.2T токенов с датасетом Dolma v1.7 на первом этапе и FineWeb-edu и Cosmopedia на втором.

По проведенным замерам, средняя производительность Bamba-9B почти сравнима с Llama 3.1 8B (45.53 против 44.68), при том что Llama 3.1 8B была обучена на 7x большем объеме данных.

Bamba-9B превзошла Olmo 7B, обученную на идентичном количестве токенов и наборах данных. В сравнении с другими моделями на базе Mamba/Mamba2, Bamba-9B показывает хорошие результаты, при этом обеспечивая значительное улучшение (до 5x) эффективности логического вывода.

▶️ Планы разработчиков на дальнейшее развитие Bamba:

🟠увеличение длины контекста модели Bamba-9B (сейчас - 4096);
🟠улучшение модели путем обучения на дополнительных данных и точной настройки на наборах данных SFT.

▶️ Опубликованный набор моделей:

🟢

Bamba 9B - финальная версия модели после 2-х этапов обучения

🟢

Bamba 9B 2T - чекпоинт после 1 этапа трейна с датасетом Dolma v1.7

🟠

Bamba 9B 1.8T - промежуточный чекпоинт 1 этапа обучения

🟢

Bamba 9B FP8 - квантованная с помощью llm-compressor версия Bamba 9B

🟢

Bamba 9B 2T FP8 - квантованная с помощью llm-compressor версия Bamba 9B 2Т

🟠

Bamba 9B 1.8T FP8 - квантованная с помощью llm-compressor версия Bamba 9B 1.8Т

▶️Пример инференса на Transformers с Bamba-9B:

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("ibm-fms/Bamba-9B")
tokenizer = AutoTokenizer.from_pretrained("ibm-fms/Bamba-9B")

message = ["Mamba is a snake with following properties  "]
inputs = tokenizer(message, return_tensors='pt', return_token_type_ids=False)
response = model.generate(**inputs, max_new_tokens=64)
print(tokenizer.batch_decode(response, skip_special_tokens=True)[0])

📌Лицензирование: Apache 2.0 License.

🟡

Статья

🟡

Набор моделей

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #Bamba #IBM

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5🔥2👍1

2.29K views12:31

Машинное обучение RU

🔥

LlamaFS — саморганизующаяся файловая система, которая автоматически переименовывает и упорядочивает файлы на основе их содержимого и известных конвенций (например, по времени)!

🌟 Она использует модель Llama 3 для обработки данных и предлагает два режима: пакетный и демон для наблюдения за файловой системой. Встроенные функции ускоряют организацию файлов, и есть возможность работы в "инкогнито" для защиты приватности.

🔐 Лицензия: MIT

🖥

Github

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤1

2.74K views13:01

⚡️ Математика машинного обучения.Базовые понятия тензорного исчисления. Урок 3

📌 Видео
📌 Урок 1 / Урок2
📌 Colab

🔥6👍2🥰1

2.66K views17:11

Машинное обучение RU

🔥

Sparrow — это инструмент для обработки данных с использованием машинного обучения (ML), больших языковых моделей (LLM) и Vision LLM от Katana ML!

💡 Он предназначен для эффективного извлечения данных из неструктурированных документов, таких как счета, банковские выписки и квитанции.

🔍 Основные компоненты Sparrow включают:

🌟 Sparrow Parse — для парсинга документов.

🌟 Sparrow OCR — для распознавания текста с помощью оптического распознавания символов (OCR).

🌟 Sparrow UI — пользовательский интерфейс для управления задачами.

💡 Инструмент поддерживает как локальные, так и облачные вычисления и может работать с различными бэкендами, такими как Hugging Face и Apple MLX.

🔐 Лицензия: GPL-3.0

🖥

Github

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤2🔥2

2.82K views19:15

Машинное обучение RU

Блогер Zara Dar, известная своими объяснениями математики и машинного обучения, решила отказаться от защиты докторской диссертации ради работы на платформе OnlyFans. Ранее она занималась этим проектом как хобби, однако со временем доходы от OnlyFans стали настолько значительными, что позволили ей приобрести автомобиль, дом и продолжить обучение без необходимости брать студенческий кредит.

Основная причина этого решения заключается в том, что получение докторской степени могло бы привести к жизни с относительно невысоким доходом и обязанностью выполнять работу, которая не всегда приносит удовольствие.

@machinelearning_ru

😢19😁14❤11👍3👎3🔥3🎉2

4.52K viewsedited 14:31

📹 Новый искусственный интеллект генерация сверхвысового разреешения - работает на 10 x быстрее

📌 Источник

@machinelearning_ru

👍6🔥3❤2👎1

3.06K viewsedited 10:58

Машинное обучение RU

Forwarded from Machinelearning

🌟 CAD-Recode: создание САПР-моделей из облаков точек.

CAD-Recode - модель для преобразования облака точек в последовательность эскизов и экструзии, записанных как код Python с использованием библиотеки CadQuery. CAD-Recode способен создавать точные CAD модели с минимальным количеством входных точек, а возможность редактирования кода с помощью LLM открывает новые возможности для интерактивного изменения геометрии САПР-моделей.

CAD-Recode состоит из двух частей: проектора, который переводит облака точек в данные для обработки, и LLM на основе Qwen2-1.5B, в которой был сохранен оригинальный токенизатор и добавлен один дополнительный линейный слой.

Модель обучалась на 1 млн. CAD-моделей. Качество обучения модели оценивалось по 3 показателям: расстоянию Хаусдорфа (CD), пересечению над объединением (IoU) и доле неверных результатов (IR).

Эксперименты с полученной моделью проводились на 3 датасетах: DeepCAD, Fusion360 и CC3D.

CAD-Recode показал значительное улучшение по сравнению с другими методами, достигнув медианного CD в 0.168 на DeepCAD и 0.159 на Fusion360. CAD-Recode продемонстрировал 76.5% точность при ответе на вопросы по САПР (CAD-QA) при использовании GPT-4o.

В репозитории проекта на Github доступна простая демонстрация инференса CAD-Recode. Перед использованием необходимо установить пакеты в соответствии с Dockerfile и затем запустить demo.ipynb в jupyter.

📌Лицензирование: Apache 2.0 License.

🟡

Модель

🟡

Arxiv

🟡

Demo

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #CADRecode

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤5👍2

2.94K views13:16

Машинное обучение RU

Свежий мини-курс по работе с моделями типа O1 и другими «reasoning»-моделями.

Это официальный гайд по промптингу, созданный в сотрудничестве с OpenAI и ключевым разработчиком Колином Джарвисом (главой подразделения решений в области искусственного интеллекта).

Курс научит вас новым важным техникам для модификации запросов, выполнения планов, генерации кода, рассуждений и многого другого.

Он поможет улучшить ответы нейросети O1, ведь стандартные методы промпт-инжиниринга зачастую приводят к ухудшению качества ответов.

Гайды разработаны при участии OpenAI, поэтому им можно доверять:

https://www.deeplearning.ai/short-courses/reasoning-with-o1/

👍3❤2🔥1

2.79K views22:46

Машинное обучение RU

👩‍💻

pykan — это проект, который реализует Kolmogorov-Arnold Networks (KANs)!

💡 KAN (сеть Колмогорова-Арнольда) представляет собой тип искусственных нейронных сетей, который отличается от классических многослойных перцептронов (MLP). В KAN используются особые функции активации на рёбрах сети, что позволяет решать задачи с высокой точностью и интерпретируемостью.

🔍 Возможности использования:

🌟 Научные задачи: Благодаря своей точности и способности моделировать сложные зависимости, KAN может использоваться для вычислительных задач, таких как решение сложных дифференциальных уравнений или моделирование физических процессов.

🌟 Нейронные сети и машинное обучение: KAN может быть использован для задачи обучения с учётом данных, которые трудно моделировать с использованием стандартных MLP или других популярных архитектур.

🔐 Лицензия: MIT

📖

Arxiv

🖥

Github

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

😁17🤩6👍4❤2🔥1

3.37K views10:45

⚡️ Тензорное разложении и его применении в машинном обучении. Урок 4

📌 Видео
📌 Урок 1 / Урок2 / Урок3
📌 Colab

👍5🔥2❤1

2.85K views16:10

Машинное обучение RU

🔥

Kheish — платформа для оркестрации многоагентных рабочих процессов с использованием LLM!

🌟 Она поддерживает внешние модули и технологии RAG для работы с большими кодовыми базами. Платформа позволяет интегрировать различные агенты (предложитель, рецензент, валидатор, форматировщик) и модули (например, файловая система или команды shell) для выполнения сложных задач в виде последовательности шагов, основанных на YAML-конфигурациях.

🔐 Лицензия: Apache-2.0

🖥

Github

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤1🔥1

2.67K views17:33

2025/09/20 17:18:18
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>