Telegram Web
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ DepthFlow: Images to → 3D Parallax effect video

DepthFlow — это продвинутый конвертер изображений в видео с 3D-параллакс-эффектом, позволяющий превращать статичные фотографии в динамичные анимации!

🌟 Инструмент позволяет получать высокое качество генераций с плавными зациклеваниями, с отсутствием артефактов на краях.

В DepthFlow добавлены настраиваемые пресеты для достижения профессионального вида анимаций.

Быстрая обработка происходит благодаря оптимизированному шейдеру GLSL, работающему на GPU. Рендеринг до 8k50fps с RTX 3060, поддердивает экспорт видео с любым разрешением.

Дополнительные функции включают использование апскейлеров и пост-эффекты, такие как искажение линз, глубина резкости и тд .

🔐 Лицензирование: AGPL-3.0

Github: https://github.com/BrokenSource/DepthFlow
Docs: https://brokensrc.dev/depthflow/
ComeUI: https://github.com/akatz-ai/ComfyUI-Depthflow-Nodes

@ai_machinelearning_big_data


#computervision #shadertoy #depthmaps #depthmap #depthprediction #parallaxeffect #monocular #imagetovideo #depthy #shaderflow
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
🔥 Langfuse — это открытая платформа для работы с большими языковыми моделями!

🌟 Она предоставляет инструменты для наблюдения за LLM, управления запросами, оценки их производительности и аналитики. Платформа интегрируется с различными фреймворками, такими как Langchain, LlamaIndex и OpenAI SDK, и может быть использована как в облаке, так и на локальном сервере.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍2
Media is too big
VIEW IN TELEGRAM
🧠 Разбираем Функцию Радемахера. Машинное обучение Курс математики

- Видео
- Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 /
- Урок6/ Урок7/ Урок8 / Урок9
- Colab
-Полный курс

@machinelearning_ru
👍51🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 RAGFlow — это open-source движок для Retrieval-Augmented Generation (RAG), основанный на глубоком понимании документов!

🌟 Он помогает компаниям организовывать поток работы с ИИ-моделями, обеспечивая точные ответы на вопросы с обоснованными ссылками на сложные форматы данных. RAGFlow предлагает интеграцию с LLM, анализ макетов документов и гибкую конфигурацию для различных масштабов бизнеса.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍123🔥2
🔥 Ovis2 мультимодальная LLM, выпущенная командой Alibaba AIDC.

1B/ 2B /4B/8B/16B/34B
Мощный CoT для более глубокого решения проблем
Поддержка многоязычного OCR — за пределы английского и китайского языков, с проработанной системой извлечением данных

HF: https://huggingface.co/collections/AIDC-AI/ovis2-67ab36c7e497429034874464
Github: https://github.com/AIDC-AI/Ovis
Paper: https://arxiv.org/abs/2405.20797

@machinelearning_ru
👍5🔥32👎1
Forwarded from Machinelearning
🌟 Common Corpus: обновление большого набора данных.

Common Corpus - обширный открытый текстовый набор данных на 2 трлн. токенов. Набор разработан PleIAs в сотрудничестве с рядом партнёров и отличается от других датасетов высоким уровнем открытости и возможностью отслеживания происхождения данных.

В обновленную версию были включены материалы, не защищенные авторским правом или распространяемые на основе открытых лицензий.

Common Corpus содержит информацию объемом 10 млрд. токенов для каждого из 8 основных языков (английский, немецкий, французский, испанский, итальянский, польский, греческий и латынь) и 1 млрд. токенов для каждого из 33 дополнительных языка.

В состав Common Corpus входят научные публикации, правительственные и юридические документы, программный код и материалы культурного наследия - книги и газеты.

Все исходные данные для датасетов Common Corpus прошли тщательную модерацию, строгий отбор, коррекцию орфографических ошибок и удаление нежелательного или недостоверного контента.

Common Corpus соответствует положениям AI Act и предоставляет возможность обучения моделей, совместимых с принципами открытого ИИ и может быть использован в коммерческих и некоммерческих целях.

📌Набор данных структурирован в виде 6 коллекций:

🟢OpenCulture - материалы, находящиеся в общественном достоянии, архивные газетные публикации и ресурсы проектов Wikisource и Gutenberg (886 млрд. токенов);

🟢OpenGovernment - финансовая и юридическая документациия из SEC, WTO, Europarl и Caselaw Access Project (406 млрд. токенов);

🟢OpenSource - программный код из репозиториев GitHub, прошедший отбор с использованием системы ArmoRM (283 млрд. токенов);

🟢OpenScience - академические материалы из баз данных Open Alex и других открытых научных хранилищ (281 млрд токенов);

🟢OpenWeb - данные из Wikipedia, YouTube Commons и платформы Stack Exchange (73 млрд. токенов);

🟢Open Semantic - семантические данные из Wikidata, обработанные при участии Wikidata и Wikimedia Germany (67 млрд. токенов).

📌Каждый документ в Common Corpus сопровождается метаданными:

identifier - уникальный идентификатор текстового документа;
collection - название коллекции, к которой относится документ;
license - информация о лицензии;
date - дата создания документа;
title - заголовок документа;
creator - автор или источник публикации;
language - язык документа;
word_count, token_count - количественные показатели: число слов и токенов;
text - текстовое содержание документа.


@ai_machinelearning_big_data

#AI #ML #Dataset #PlelAs #CommonCorpus
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥3👍1
✔️ Anthropic готовится к выпуску новых гибридных моделей с возможностями рассуждения.

Anthropic готовится к выпуску новой модели, объединяющей возможности традиционной LLM с расширенными функциями рассуждения. Ожидается, что модель будет доступна в ближайшие недели и ориентирована на корпоративных клиентов.

Ключевая особенность новой модели - переменное распределение ресурсов, позволяющее пользователям регулировать вычислительную мощность, используемую моделью для каждой задачи, с помощью простого слайдера. На минимальном уровне модель функционирует как стандартная LLM без цепочки рассуждений.
theinformation.com

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥21
⚡️ Разбор собеседования по машинному обучению в Озон 2025

https://uproger.com/razbor-sobesedovaniya-po-mashinnomu-obucheniyu-v-ozon-2025/

@machinelearning_ru
👍71🔥1
🖥 openai-python — официальная библиотека Python для взаимодействия с API OpenAI!

🌟 Эта библиотека позволяет разработчикам интегрировать возможности OpenAI, такие как GPT, в приложения, предоставляя как синхронный, так и асинхронный интерфейсы.

💡 Библиотека поддерживает Python 3.8+ и включает типы для всех параметров запросов и ответов, упрощая разработку. Она предоставляет удобные методы для работы с генерацией текста, изображений, аудио и других функций, доступных через OpenAI API.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥1😱1
🔥 Sourcegraph Cody — это открытый AI-ассистент для программирования, который помогает разработчикам быстрее писать, понимать и исправлять код!

🌟 Он интегрируется с популярными редакторами, такими как VS Code и JetBrains, предоставляя поддержку при разработке на основе локального и удалённого контекста кодовой базы. Cody использует современные языковые модели, включая GPT-4 и Claude 3.5, для предоставления рекомендаций, анализа API, поиска символов и шаблонов использования.

🌟 Cody позволяет использовать продвинутые функции поиска по кодовой базе, чтобы получать контекст и советы прямо в IDE. Он поддерживает гибкое масштабирование для работы с большими проектами, обеспечивая помощь в исправлении ошибок, создании новых функций и улучшении структуры кода.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32
Forwarded from Machinelearning
✔️ Gemini теперь "помнит" историю чатов.

Google расширила возможности Gemini, внедрив функцию запоминания прошлых разговоров для подписчиков Gemini Advanced через Google One AI Premium. Это обновление позволяет Gemini предоставлять более релевантные ответы. Новая функция доступна на английском языке в веб-версии и мобильном приложении Gemini. Google планирует добавить поддержку других языков, а также для бизнес- и корпоративных клиентов Google Workspace в ближайшие недели.
blog.google

✔️ Увеличение частоты таймера ядра Linux повышает производительность ИИ.

Предложение инженера Google об увеличении частоты таймера ядра Linux с 250 до 1000 Гц вызвало интерес в технологическом сообществе и сервис Phoronix провел A/B-тестирование, чтобы оценить влияние этого изменения. Наиболее заметные улучшения наблюдались в ускорении LLM. В других задачах влияние было минимальным и находилось в пределах погрешности измерений системы. Основная идея Кайса Юсефа заключалась в том, что увеличение частоты таймера приведет к улучшению отзывчивости системы и позволит решить проблемы, связанные с 250 Гц: неточные временные интервалы и задержки в балансировке нагрузки.

Тестирование проводилось на AMD Ryzen 9 9950X, 32 ГБ ОЗУ и GPU Radeon RX 7900 XTX. Наибольший прирост производительности наблюдался с Llama, где увеличение частоты таймера привело к росту производительности на 10%.
tomshardware.com

✔️ Apple предложила парадигму претрейна и трансферного обучения для ускорения физического моделирования.

Apple Machine Learning Research опубликовало исследование метода трансферного обучения для графовых нейронных сетей, который значительно улучшает эффективность и точность физического моделирования сложных систем. В работе представлена масштабируемая графовая U-NET (SGUNET), способная адаптироваться к различным размерам сетки и разрешениям.
Предложенный метод позволяет использовать предварительно обученные модели на большом наборе данных (ABC Deformable - ABCD), содержащем 20 000 физических симуляций 3D-форм, для последующей тонкой настройки на целевых задачах с меньшим количеством данных. Это значительно снижает затраты на сбор и аннотацию данных.

Эксперименты на 2 датасетах (2D Deformable Plate и 3D Deforming Plate) показали, что модель, предварительно обученная на ABCD и дообученная на 1/16 части данных, демонстрирует улучшение RMSE на 11.05% по сравнению с моделью, обученной с нуля.
machinelearning.apple.com

✔️ GenAI снижает когнитивные усилия и вредит критическому мышлению.

Microsoft и Университет Карнеги опубликовали ресёрч о том, что генеративный ИИ оказывает двоякое влияние на когнитивные процессы человека. С одной стороны, ИИ-инструменты снижают воспринимаемую сложность задач, требующих критического мышления. С другой стороны, чрезмерная уверенность в возможностях ИИ приводит к снижению критического мышления и зависимости от сгенерированного контента.

Анализ опроса 319 представителей умственного труда показал, что работники чаще всего используют критическое мышление для обеспечения качества своей работы. При этом, чем выше уверенность работника в собственных навыках, тем больше усилий он прилагает для оценки результатов, предоставляемых ИИ. И наоборот, чем выше уверенность в возможностях ИИ, тем меньше усилий затрачивается на критическое мышление. Исследование также выявило изменения в структуре когнитивных усилий при использовании ИИ - они смещаются от сбора информации к ее проверке, от решения проблем к адаптации ответов ИИ и от выполнения задач к контролю за процессом.
microsoft.com

✔️ OpenAI советует упростить промпты для новых моделей рассуждений.

Новые рекомендации OpenAI указывают на то, что для эффективного использования моделей серии o, стоит отходить от сложных техник промпт-инжиниринга в пользу простых и прямых инструкций. OpenAI предостерегает от использования "boomer prompts" и инструкций вроде "думай шаг за шагом" для этих моделей. Вместо этого рекомендуется давать краткие, четко структурированные указания с использованием разделителей (XML-теги) и четко определять критерии успеха или ограничения.
platform.openai.com
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🤩1
✔️ Chonkie — это open-source инструмент для быстрого прототипирования и проведения экспериментов в области машинного обучения.

Чем полезен:
- Прототипирование и модульность:
Интуитивный API и модульная архитектура позволяют быстро настраивать модели, обрабатывать данные и менять гиперпараметры.

- Гибкость:
Возможность модификации исходного кода под конкретные задачи, а также интеграция с популярными фреймворками, такими как PyTorch или TensorFlow.

- Быстрая обратная связь:
Инструмент ускоряет процесс экспериментов, обеспечивая оперативное получение результатов обучения.

Установка:
pip install chonkie

Chonkie идеально подходит для исследователей и разработчиков, которым важна скорость экспериментов и гибкость настройки, но может быть ограничен для масштабных промышленных проектов.

Github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥2🥰2
Forwarded from Haskell
«Large Lambda Model» крутой гайд, где автор делится опытом реализации инференса модели GPT-2 на языке Haskell с использованием библиотеки hmatrix и OpenBLAS.

Основная цель проекта — выполнить прямой проход (forward pass) модели без обучения или обратного распространения ошибки.

Этот проект демонстрирует, как можно реализовать инференс модели GPT-2 на Haskell, углубляясь в детали архитектуры и работы с линейной алгеброй без использования специализированных тензорных библиотек.

Выбор инструментов:
Haskell и hmatrix: Использование Haskell с hmatrix для линейной алгебры.
OpenBLAS: Применение для оптимизации линейных операций.
Архитектура GPT-2:


Ресурсы для изучения:
- Репозитории Karpathy: NanoGPT и llm.c.
Визуализатор LLM от Brendan Bycroft.
Веб-приложение для токенизации: tiktokenizer.

Читать

@haskell_tg
🔥41👍1
Forwarded from Machinelearning
✔️ OpenAI только что опубликовала статью, в которой описан план создания лучшего в мире ИИ-кодера.
В статье исследуется применение обучения с подкреплением (RL) к большим языковым моделям (LLMs) улучшает их способность решать сложные задачи программирования и рассуждений. Авторы сравнивают три модели: общую модель o1, её специализированную версию o1-ioi (адаптированную для соревнований IOI) и более продвинутую модель o3.

Модель o1 значительно превосходит модели без цепочек рассуждений (например, gpt-4o) по показателям на платформе CodeForces.
Специализированная o1-ioi, оптимизированная для соревнований IOI, показывает хорошие результаты с ручными стратегиями, но её успех зависит от дополнительной настройки и тестовых стратегий.
Модель o3, обученная только с RL и без доменно-специфичных стратегий, демонстрирует ещё более высокую производительность, достигая результатов на уровне элитных программистов мира как на CodeForces, так и на IOI.
Применение в реальных задачах:
Масштабирование RL для общего использования, а не применение специализированных ручных стратегий, является эффективным путём достижения передового уровня ИИ в задачах рассуждения и программирования.
Статья

✔️ Google о квантовых вычислениях «Наш последний прорыв: мы смогли выполнить сложные вычисление за 5 минут, на что одному из самых быстрых суперкомпьютеров в мире потребовалось бы более 10 миллиардов лет — это дольше, чем существует наша Вселенная».
Тред

✔️ Илон Маск анонсировал выпуск новой версии Grok 3 от его стартапа xAI. Он заявил, что это будет «самый умный ИИ на земле»
Релиз состоится 18 февраля в 04:00 (GMT+3). Похоже, что Grok-3 выйдет с режимом рассуждений.

✔️ Вслед за «Последним экзаменом человечества» ScaleAI
выпустили новую очень сложную оценку рассуждений LLM:

EnigmaEval: 1184 мультимодальные головоломки, настолько сложные, что на их решение группам людей требуется от многих часов до нескольких дней.
Все топ-модели набрали 0% в Hard set и < 10% в Normal set
Scale

✔️ 4 SOTA модели компьютерного зрения
От оценки позы до обнаружения объектов в реальном времени - свежие, передовые инструменты компьютерного зрения на Hugging Face, которые очень просты в использовании.
- ViTPose для оценки позы
- RT-DETRv2 для обнаружения объектов в реальном времени
- DAB-DETR улучшает оригинальный DETR, решая проблемы медленного обучения
- DepthPro от Apple для оценки глубины на одном изображении, выдавая расстояния на уровне пикселей в метрах менее чем за секунду.

✔️ Computer use ootb
Свежий инструмент, который представляет собой готовое решение для создания десктопного GUI-агента. С его помощью можно отдавать команды и автоматизировать задачи на ПК (Windows и macOS) через веб-интерфейс, доступный с любого устройства с интернетом.
Github

@ai_machinelearning_big_data


#news #ai #ml #openai #grok #grok3 #Microsoft #ScaleAI #elonmusk #cv #sota #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👎2🔥1🥰1
2025/07/09 15:14:18
Back to Top
HTML Embed Code: