Telegram Web
🔥 AI Youtube Shorts Generator — это инструмент Python, разработанный для создания увлекательных коротких Shorts видео на YouTube из обычных длинных видео!

🌟 Используя возможности GPT-4 и Whisper, он извлекает самые интересные моменты, определяет говорящих и обрезает контент по вертикали для коротких видео.

🔐 Лицензия: MIT

🖥 Github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Forwarded from Machinelearning
🧩 Новая архитектура нейросетей от Samsung: Tiny Recursive Model (TRM) - обошла DeepSeek-R1, Gemini 2.5 Pro и o3-mini в задачах рассуждения ARC-AGI 1 и ARC-AGI 2.

✔️ Размер модели - всего 7 миллионов параметров и около 1000 обучающих примеров.

Это меньше в 10 000 раз, чем у современных LLM, но результат лучше.

Как работает TRM:

1️⃣ Черновой ответ: модель сразу формирует быстрый набросок решения, а не пишет его по словам.
2️⃣ Скрачпад: создаёт внутреннее пространство для логики и промежуточных рассуждений.
3️⃣ Самокритика: многократно (6 раз) проверяет свои рассуждения, уточняя и исправляя ошибки.
4️⃣ Переписывание: на основе улучшённой логики создаёт новую, более точную версию ответа.
5️⃣ Цикличность: повторяет процесс до 16 раз, пока не достигнет уверенного, логически цельного решения.

💡 Чем интересна модель:

- Меньше затрат на вычисления, а результат выше; высокая эффективность при низких издержках.
- Доказательство того, что собственная логика и архитектура могут быть сильнее простого размера модели. Можно коротко описать ее: «думай, прежде чем действовать».
- Мощные рассуждающие системы становятся доступными даже без огромных кластеров, модель можно запускать на ограниченных ресурсах.

Это не просто «компактаная LLM», это другой способ мышления: модель, которая действительно *думает, прежде чем говорить*.

🟠Статья: https://arxiv.org/abs/2510.04871v1
🟠Github: https://github.com/SamsungSAILMontreal/TinyRecursiveModels

@ai_machinelearning_big_data

#TinyRecursiveModels #TRM #DeepLearning #NeuralNetworks
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
9👍7
Media is too big
VIEW IN TELEGRAM
🤖 Figure 03 - первый гуманоидный робот для массового рынка

Figure AI представила Figure 03 - третье поколение своего гуманоида и первый робот, созданный специально для массового производства.

Робот обучается напрямую через взаимодействие с людьми и способен выполнять бытовые и рабочие задачи, от дома до складов и отелей. Его ИИ-система Helix объединяет зрение, язык и действия, позволяя действовать естественно в человеческой среде.

Корпус теперь выполнен из моющихся мягких материалов, без открытых механизмов, а вес снижен на 9% по сравнению с предыдущей моделью. Производство переведено на литьё и формование вместо CNC, что значительно ускоряет выпуск. Компания рассчитывает выпускать 12 000 роботов в год и достичь 100 000 за четыре года.

У Figure 03 обновлён сенсорный пакет: шире поле зрения камер, встроенные камеры в ладонях, чувствительные сенсоры давления и новая аудиосистема, лучше распознающая звуки.

Робот можно «переодевать» — для работы в разных условиях предусмотрены разные униформы. Зарядка — беспроводная, с передачей данных.

На видео Figure 03 движется плавно и уверенно, взаимодействуя с людьми и бытовыми устройствами. Но как поведёт себя робот вне демонстрационных роликов — покажет время. Цену компания пока не раскрыла.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2🥰1
🧩 Примеры приложений для Apps SDK от OpenAI

Этот репозиторий демонстрирует примеры UI-компонентов и MCP-серверов для создания приложений на базе ChatGPT. Он служит отправной точкой для разработки собственных приложений, используя Model Context Protocol для интеграции инструментов и интерфейсов.

🚀 Основные моменты:
- Примеры компонентов для Apps SDK.
- Демонстрация работы MCP-серверов.
- Поддержка различных языков программирования (Node.js, Python).
- Возможность создания и кастомизации собственных виджетов.
- Легкая интеграция с ChatGPT.

📌 GitHub: https://github.com/openai/openai-apps-sdk-examples
2👍2🔥1
Forwarded from Machinelearning
🔥 Сенсей Карпаты выложил новый репозиторий - полный пайплайн обучения LLM с нуля

В проекте есть всё, чтобы собрать свой ChatGPT-клон за $100 и 4 часа:

> • токенизатор
> • pretraining
> • SFT (supervised fine-tuning)
> • RL (reinforcement learning)
> • оценка модели (eval)

Всего 8 000 строк кода, без лишних зависимостей - идеальный учебный пример, чтобы понять, как реально устроено обучение больших языковых моделей.

💡 Это проект из его нового курса Карпаты LLM101n, и отличная возможность прокачать свои ML-навыки на практике.

Можно арендовать GPU в облаке и запустить всё самому - код уже готов к запуску.

Если запустить обучение модели nanochat на облачном GPU-сервере (например, 8×H100), то примерно через 12 часов обучения (стоимость ~300–400 $) модель достигает уровня GPT-2 по качеству на тестовых наборах (CORE-score).

А если тренировать около 40 часов (затраты ~1000 $), решает простые задачи по математике и коду, набирая:
- 40+ на MMLU
- 70+ на ARC-Easy
- 20+ на GSM8K

🧠 Это бесплатная практика топ уровня от мастера, которую не стоит упускать.

🟠GitHub:https://github.com/karpathy/nanochat
🟠Технические детали: https://github.com/karpathy/nanochat/discussions/1

@ai_machinelearning_big_data


#LLM #nanochat #MachineLearning #DeepLearning #AI #GPT
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥94👍1
🚀 Microsoft представила MAI-Image-1 - новую модель генерации изображений, которая уже вошла в топ-10 на LMArena

MAI-Image-1 создаётся с упором на реализм, разнообразие и художественную точность, а не шаблонные стили.
Она особенно сильна в фотореалистичных сценах - свет, тени, отражения и текстуры выглядят максимально естественно.

Microsoft отмечает, что обучение велось на тщательно отобранных данных с участием художников и дизайнеров, чтобы улучшить восприятие и применимость модели в реальных проектах.

Главное преимущество — скорость и качество: можно мгновенно визуализировать идею, а затем доработать её в привычных инструментах.

💡 В ближайшее время модель появится в Copilot и Bing Image Creator, но уже сейчас её можно протестировать и оценить в LMArena.

🔗 Подробнее здесь: https://microsoft.ai/news/introducing-mai-image-1-debuting-in-the-top-10-on-lmarena/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍4🔥2
🔥 Команда AI VK открыла регистрацию на VK RecSys Challenge

Ребята из RecSys VK снова придумали что-то интересное и снова запустили соревнование по созданию рекомендательных алгоритмов. В этом году задача непростая: построить модель, которая предскажет, кому может понравиться новый клип, даже если его еще никто не видел.

Участникам предстоит работать с реальными данными большого датасета VK-LSVD, включающего 40 млрд обезличенных взаимодействий с 20 млн коротких видео.

📊 Основные условия:
- участие индивидуально или в команде до 4 человек;
- регистрация открыта до 15 декабря;
- призовой фонд: 2,5 млн руб.

Все решения автоматически проверяются на закрытой тестовой выборке с расчетом метрики качества, а лучшие модели будут представлены 17 января.

🔗 Регистрация
5🔥3👏2😁1
🚀 Высокопроизводительный движок полнотекстового поиска на Go

Blaze — это мощный движок для быстрого полнотекстового поиска с использованием инвертированных индексов. Он идеально подходит для приложений, которые требуют эффективного поиска по текстовым документам без зависимости от внешних поисковых систем.

🚀 Основные моменты:
- Инвертированный индекс для мгновенного поиска
- Поддержка булевых запросов и фразового поиска
- Алгоритм BM25 для оценки релевантности
- Безопасный для потоков с поддержкой конкурентного индексирования
- Компактное бинарное хранилище для данных

📌 GitHub: https://github.com/wizenheimer/blaze
3👍2🔥1
⚡️ Microsoft представила новый стандарт оценки ИИ для кибербезопасности - ExCyTIn-Bench

Microsoft запустила ExCyTIn-Bench - открытую платформу, которая тестирует, как ИИ справляется с реальными инцидентами безопасности, а не просто отвечает на теоретические вопросы.

Что делает ExCyTIn-Bench

- Имитация настоящего SOC (Security Operations Center) с логами, инцидентами и хаосом реальных атак.
- Проверяет не только ответы, но и логику рассуждений ИИ: шаги, объяснения, приоритизацию угроз.
- Включает 57 таблиц логов из Microsoft Sentinel — максимально приближено к практике.
- Поддерживает сравнение разных моделей и метрик, включая reasoning-оценку (пошаговое мышление).

Зачем это нужно

Обычные тесты “вопрос-ответ” не отражают реальную сложность киберугроз.
ExCyTIn-Bench поднимает планку: теперь модели должны мыслить как аналитики SOC.

Microsoft уже использует этот бенчмарк для проверки своих продуктов — Security Copilot, Defender и Sentinel.
Первые результаты показывают, что продвинутые LLM вроде GPT-5 уже уверенно анализируют инциденты и выстраивают цепочку атак.

🔗 Подробнее: https://www.microsoft.com/en-us/security/blog/2025/10/14/microsoft-raises-the-bar-a-smarter-way-to-measure-ai-for-cybersecurity/


#Microsoft #CyberSecurity #AI #SecurityCopilot
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
Один One Day Offer вам или целых три — всем? 😉

25 октября Сбер проведёт сразу три экспресс-отбора кандидатов в две команды: GigaData и Kandinsky. Чем вам предстоит заниматься 👇

✔️ Развивать GigaData — внутреннюю платформу Сбера, которая обрабатывает петабайты данных и миллиарды запросов в сутки. One Day Offer для Python‑разработчиков.

✔️ Работать над Kandinsky — обучать большие модели с нуля, собирать и подготавливать данные, исследовать самые эффективные методы дообучения моделей.

One Day Offer для Machine Learning Engineers с опытом в Deep Learning и компьютерном зрении (CV).
One Day Offer для Research и Deep Learning Engineers.

Выбирайте то, что больше подходит под ваши навыки, и регистрируйтесь на One Day Offer!
👍1🤬1
🚀 Создание AI-агентов без кода

Open Agent Builder — это визуальный конструктор для разработки и развертывания рабочих процессов AI-агентов. Используя интерфейс перетаскивания, вы можете легко создавать сложные потоки, включая автоматизацию исследований и веб-скрапинг.

🚀 Основные моменты:
- Интуитивно понятный интерфейс для создания рабочих процессов
- Поддержка реального времени с обновлениями
- Интеграция с Firecrawl для веб-скрапинга
- Многофункциональные узлы для различных задач
- Поддержка аутентификации и управления пользователями

📌 GitHub: https://github.com/firecrawl/open-agent-builder
🔥51
🚀 Новый курс на Stepik: Computer Vision Engineer

Соберёте продакшн-CV: датасет → обучение (YOLO/RT-DETR/SAM, OCR/Doc-AI) → экспорт в ONNX/TensorRT/OpenVINO → API на FastAPI → мониторинг (Prometheus/Grafana). Практика на реальных кейсах: пустые полки, дефекты, документы.

🎯 Результат — сервис с метриками mAP/IoU, p95-latency и cost/req.

🔥 Скидка 30% по промо COMPUTERVISION (48 ч)

👉 Пройти со скидкой
1
🧠 Новая работа показывает, что даже небольшая open-source модель может решать сложные математические задачи — если заставить её "думать дольше" с помощью циклов саморазвития рассуждений.

Исследователи взяли 8B-модель на базе DeepSeek и заставили её проходить долгие итеративные reasoning-loops, где каждая итерация — это маленький шаг к более точному решению.
Если модель находит улучшение хоть чуть-чуть лучше предыдущего ответа, цикл продолжается.

Результат: модель решила 5 задач AIME, которые раньше не могла, и даже превзошла точность своего «учителя» — 600B-модели, если брать голосование по итоговым ответам из множества параллельных циклов.

Метод прост:
1️⃣ Проверить текущий ответ
2️⃣ Исправить ошибки
3️⃣ Повторять несколько десятков итераций

Такой подход увеличивает время вычислений на тесте, но даёт гораздо более надёжные решения, фактически расширяя пределы возможностей малых моделей.

📄 Paper: arxiv.org/abs/2510.17498
7🔥1
2025/10/23 02:04:18
Back to Top
HTML Embed Code: