Telegram Web
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Китай выходит в лидеры мировой робототехники

Китай стремительно превращается в мирового лидера по производству и внедрению гуманоидных роботов. В стране формируется полный цикл - от датчиков и приводов до готовых автономных систем.

По данным издания, только за прошлый год на китайских заводах установлено около 300 тысяч промышленных роботов, что больше, чем во всём остальном мире вместе взятом. И почти все они - китайского производства.

Компания Unitree уже выпустила гуманоидного робота R1 стоимостью менее 6 000 долларов, что в несколько раз дешевле предыдущих моделей. Это стало возможным благодаря высокой локализации производства и быстрой обратной связи между разработчиками и фабриками.

Демографический кризис и старение населения подталкивают Китай к автоматизации. Правительство активно поддерживает отрасль - создаёт тестовые полигоны, субсидирует стартапы и внедряет роботов в промышленность и сервис.

Если США не активизируют собственные программы в области робототехники, Китай может занять доминирующее положение в одной из ключевых технологий XXI века.
washingtonpost

✔️ Microsoft и Georgia Tech научили ИИ думать “молча”

Исследователи создали систему SwiReasoning, которая позволяет языковым моделям решать, когда говорить, а когда просто думать. Вместо того чтобы постоянно проговаривать свои шаги, как в Chain-of-Thought, модель теперь может рассуждать скрыто - в латентном пространстве.

Когда уверенность низкая, она «думает молча», обрабатывая идеи внутри в виде непрерывных векторов. Когда уверенность возрастает - «высказывает» выводы словами. Такой гибкий режим делает рассуждения в среднем на 56–79% эффективнее, а в пике - до 6.78 раза быстрее, без потери точности.

Исследователи называют это началом новой эры latent reasoning - когда ИИ размышляет не словами, а понятиями.
Paper

✔️ xAI разрабатывает world models - продвинутые системы ИИ, способные понимать и моделировать физический мир.

Для этого проекта xAI привлекла бывших специалистов Nvidia, которые будут работать над созданием ИИ, умеющего формировать реалистичные трёхмерные среды и взаимодействовать с ними.

Первым направлением применения таких моделей станет индустрия игр - xAI планирует использовать world models для генерации интерактивных 3D-миров с динамическим поведением объектов и физикой.
В будущем эти технологии могут применяться в робототехнике и других областях физического ИИ.
Согласно планам компании, первая игра, полностью созданная искусственным интеллектом xAI, должна выйти к концу следующего года.
X

✔️ Учёные научили ИИ определять СДВГ по тому, как человек видит и обрабатывает мелькающие картинки.

Модель анализирует зрительные ритмы - микропаузы между кадрами, которые мозг воспринимает по-разному у людей с и без СДВГ. Точность диагностики - 91,8%, а различить, принимает ли человек стимуляторы, ИИ смог с точностью 91%.

Метод может стать новым способом диагностики без тестов и интервью - достаточно показать короткое видео и измерить, как мозг реагирует на световые ритмы.
psypost

✔️ Microsoft запускает инструмент, который покажет начальнику, насколько активно ты пользуешься ИИ

Microsoft внедряет в свою корпоративную платформу Viva Insights новую функцию под названием Benchmarks - систему, которая позволяет менеджерам отслеживать, насколько активно сотрудники используют искусственный интеллект в рабочих приложениях. Benchmarks станет частью Copilot Dashboard, панели аналитики, которая собирает данные о взаимодействии сотрудников с инструментами Microsoft 365 - от Teams и Outlook до Word, Excel и PowerPoint.

Руководители смогут видеть процент «активных пользователей Copilot» в разных отделах, сравнивать показатели внутри компании и даже сопоставлять их с усреднёнными данными по отрасли. По официальному определению Microsoft, «активный пользователь Copilot» - это тот, кто совершил «намеренное действие с ИИ» в одном из поддерживаемых приложений.

То есть если ты хотя бы раз за месяц использовал Copilot для генерации письма, отчёта или кода - ты попадёшь в статистику
winbuzzer

@ai_machinelearning_big_data


#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2
📚 Эта статья представляет метод Chain-of-Retrieval Augmented Generation (CoRAG), который улучшает качество генерации ответов путем поэтапного извлечения релевантной информации!

🌟 В отличие от традиционных подходов, CoRAG динамически реформулирует запросы, улучшая результаты на сложных задачах, таких как мультихоп-вопросы. Эксперименты показывают значительное улучшение точности по сравнению с существующими методами.

🔗 Ссылка: *клик*

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1
📢 Калифорния первой в США выпустила закон, обязывающий ИИ признавать, что они не люди

Штат принял закон SB 243 - первый в стране, регулирующий AI-чат-ботов-компаньонов.

Основные положения:

Если пользователь может подумать, что говорит с человеком, бот обязан показать уведомление, что он искусственный интеллект.

Компании должны иметь протокол предотвращения суицида: блокировать подобный контент и направлять пользователей на горячие линии помощи.

Этот протокол должен быть опубликован на сайте.

При общении с несовершеннолетними бот обязан напоминать каждые 3 часа, что это ИИ, и советовать сделать перерыв.

Запрещено выдавать себя за врача или иного специалиста в области здоровья.

Для подростков должен быть фильтр от сексуального контента.

С июля 2027 года операторы обязаны ежегодно отчитываться в Офисе по предотвращению самоубийств о своих действиях при выявлении риска.

Пользователи смогут подавать в суд на компании — минимум на $1 000 за каждое нарушение.

В тот же день подписаны сопутствующие меры:

Закон SB 53 (сентябрь 2025) — обязывает крупных разработчиков ИИ публиковать протоколы безопасности.

Новые правила о проверке возраста, предупреждениях на соцсетях и штрафах до $250 000 за дипфейк-порнографию.

Закон принят после громких случаев и исков, связанных с вредными взаимодействиями подростков с чат-ботами, включая CharacterAI и дело о гибели пользователя ChatGPT.

techcrunch

#ai #news
5👍3👀2🔥1🤡1
🎥📊 SpatialVID: Обширный видеодатасет с пространственными аннотациями

SpatialVID предлагает более 21,000 часов видео с детализированными 3D аннотациями, включая позиции камер и карты глубины. Этот датасет создан для улучшения моделей пространственного интеллекта и подходит для исследований в области видео и 3D-визуализации.

🚀Основные моменты:
- Более 2.7 миллиона клипов с разнообразными сценами
- Аннотации включают динамические маски и структурированные подписи
- Поддержка реальных динамических сцен с точными данными о движении камер
- Уникальный ресурс для повышения обобщающей способности моделей

📌 GitHub: https://github.com/NJU-3DV/SpatialVID

#python
3👍1
Вайб Цех. Кодим на станках будущего

red_mad_robot открывают двери Вайб Цеха — места, где рождается новый стандарт разработки. Вместо станков — LLM, вместо чертежей — промпты.

Мастера из red_mad_robot, SberAI и Clоud.ru расскажут, как работает производство цифровых продуктов будущего. На сборочной линии обсудят:

01_Как промпты и LLM меняют работу инженера.
02_Рост производительности и новые возможности.
03_Вектор развития для разработчиков.

📅 25 октября, Санкт-Петербург
🎟 Ловите промокод на скидку PROMObigdatai и записывайтесь в цех: https://clck.ru/3PY7ty

Стань мастером цифровой сборки!
🔥3🤡1
🤖 Tongyi DeepResearch: мощная языковая модель для глубокого поиска

Tongyi DeepResearch — это языковая модель с 30,5 миллиарда параметров, специально разработанная для глубоких информационно-ориентированных задач. Она демонстрирует выдающиеся результаты на различных бенчмарках, включая Humanity's Last Exam и WebWalkerQA, благодаря автоматизированному синтезу данных и передовым методам обучения с подкреплением.

🚀Основные моменты:
- Высокая производительность на сложных задачах поиска.
- Полностью автоматизированный процесс синтеза данных.
- Совместимость с несколькими парадигмами вывода.
- Эффективное обучение с использованием данных агентных взаимодействий.

📌 GitHub: https://github.com/Alibaba-NLP/DeepResearch

#python
2
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 Одним выстрелом сгенерировал эмулятор Nintendo с (очень вероятно что это Gemini 3.0 Pro.)
Если так, то Gemini 3.0 разнесёт всех конкурентов.


Попросили модель сделать ретро Nintendo-сим с играми, *без внешних ассетов*.
Результат?
Через 1 минуту — готовая полноценная сцена.

Ни одна другая модель пока не показывает такого уровня стабильности и точности при генерации.

Автор выложил промпт и пруф *one-shot-генерации* в треде — и это даже не лучший результат, готовится ещё более сильная версия с чуть изменённым промптом.

Пост: https://x.com/chetaslua/status/1978438353918779461

#Gemini #GoogleAI #AIGeneration #AIModels #Multimodal #TextToGame
5👍1🔥1
🧬 ShinkaEvolve: Эволюция программ с помощью ИИ

ShinkaEvolve — это фреймворк, который сочетает большие языковые модели с эволюционными алгоритмами для автоматизации научных открытий. Он позволяет улучшать научный код, используя креативные возможности ИИ и оптимизацию через эволюцию, поддерживая параллельную оценку кандидатов.

🚀 Основные моменты:
- Комбинирует LLM и эволюционные алгоритмы.
- Поддерживает параллельную оценку на локальных машинах и кластерах.
- Хранит архив успешных решений для передачи знаний.
- Оптимизирует производительность при сохранении корректности кода.
- Идеален для научных задач с доступными проверяющими.

📌 GitHub: https://github.com/SakanaAI/ShinkaEvolve

#python
🚀 Baidu представила самую эффективную мультимодальную модель в мире

Она называется PaddleOCR-VL - монстр с 0,9 млрд параметров, который превосходит GPT-4o, Gemini 2.5 и все существующие Doc-AI-модели.

Модель понимает 109 языков, распознаёт текст, таблицы, формулы и графики, при этом работает *быстрее систем, которые в 10 раз больше по размеру.*

Секрет успеха:
- 🧠 Динамический визуальный энкодер в стиле NaViT
- 💬 Языковая модель ERNIE-4.5-0.3B
- 🧾 Интеллектуальная система разметки PP-DocLayoutV2, устраняющая галлюцинации

Всё с открытым исходным кодом и менее 1 млрд параметров.

Это не просто эффективная модель — это новый эталон мультимодального ИИ.

🔗 https://huggingface.co/PaddlePaddle
11🤓2
🖥 Полный гайд: защита от SQL-инъекций для разработчиков

SQL-инъекции остаются одной из самых частых и опасных уязвимостей в веб-приложениях. Ошибка в одном запросе — и злоумышленник получает доступ к базе данных, паролям и пользовательским данным.

В этом материале — полный практический разбор:
как именно происходят SQL-инъекции, какие ошибки разработчиков к ним приводят, как их распознать в коде и главное — как защититься.

Разберём реальные примеры на Python, PHP и Go, посмотрим, как атакующий «взламывает» запрос, и научимся писать безопасный код с параметризованными запросами и ORM.

Это не теория, а руководство, которое поможет понять уязвимость изнутри и навсегда закрыть её в своих проектах.

👉 Читать гайд
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Один One Day Offer вам или целых три — всем? 😉

25 октября Сбер проведёт сразу три экспресс-отбора кандидатов в две команды: GigaData и Kandinsky. Чем вам предстоит заниматься 👇

✔️ Развивать GigaData — внутреннюю платформу Сбера, которая обрабатывает петабайты данных и миллиарды запросов в сутки. One Day Offer для Python‑разработчиков.

✔️ Работать над Kandinsky — обучать большие модели с нуля, собирать и подготавливать данные, исследовать самые эффективные методы дообучения моделей.

One Day Offer для Machine Learning Engineers с опытом в Deep Learning и компьютерном зрении (CV).
One Day Offer для Research и Deep Learning Engineers.

Выбирайте то, что больше подходит под ваши навыки, и регистрируйтесь на One Day Offer!
👍3
🔍 Глубокое исследование проблем с ACPI на ноутбуках ASUS ROG

Этот репозиторий посвящен анализу проблем с производительностью на ноутбуках ASUS ROG, вызванным ошибками в прошивке ACPI. Исследуются причины задержек и прерываний, влияющих на работу системы, включая аудио и графику. Используются инструменты для диагностики и трассировки, чтобы выявить корень проблемы.

🚀Основные моменты:
- Анализ проблем с производительностью на ASUS ROG.
- Использование LatencyMon для выявления задержек.
- Трассировка ACPI с помощью ETW для детального анализа.
- Обнаружение системных ошибок и их влияние на работу GPU.

📌 GitHub: https://github.com/Zephkek/Asus-ROG-Aml-Deep-Dive

#c
2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Быстрее, умнее, точнее

VK запустил RecSys Challenge — соревнование по разработке алгоритмов рекомендаций.
Участникам предстоит решить одну из самых сложных проблем рекомендательных систем: предсказать, кому зайдёт ролик, который никто ещё не видел.

В основе датасет VK-LSVD:
40 млрд взаимодействий
20 млн роликов

Формат:
Студенты, исследователи, ML-инженеры — welcome
Призовой фонд — 2 500 000 рублей 💸

Читайте подробнее и регистрируйтесь до 15 декабря на сайте соревнования.
📢 Hugging Face запускает *FineWiki Viewer*

Сегодня Hugging Face сообщает о выпуске интерактивного инструмента *FineWiki Viewer* - визуальной оболочки для работы с датасетом FineWiki, содержащим в себе качественно извлечённые данные из Википедии на более чем 300 языках.

То есть теперь исследователи и инженеры могут не просто скачивать сырые тексты, а исследовать язык-данные визуально: искать темы, оценивать баланс языков и анализировать структуру.

Новая возможность - ещё один шаг Hugging Face в построении “Экосистемы данных для открытой модели ИИ”, где не только модели, но и доступные и хорошо документированные данные становятся первым ресурсом.

https://huggingface.co/spaces/HuggingFaceFW/finewiki-viewer
🔥53👍1
🔥 Интересное исследование, в ходе которого авторы анализировали миллионы твитов в X, чтобы с помощью ИИ раскрыть зависящие от них закономерности роста/падения биткоина!

🔗 Читать: *клик*

@bigdatai
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
LongCat представила VitaBench - бенчмарк для реальных сценариев работы AI-агентов

Команда LongCat выпустила VitaBench - открытый набор тестов, оценивающий, как искусственные агенты справляются с задачами из реальной жизни: доставка еды, рестораны и путешествия.

Бенчмарк проверяет три ключевых способности — рассуждение, использование инструментов и адаптивное взаимодействие.

Результаты более 20 лучших моделей оказались низкими: средний успех 30% между сценариями и 48% внутри одного. Даже топовые reasoning-модели показывают нестабильность — идеальных результатов (4 из 4 успешных запусков) нет вовсе.

Авторы отмечают, что агенты пока не готовы к надёжной работе в продакшене, но VitaBench помогает точно измерять прогресс и сложность агентных задач.

🌐 Project & Leaderboards: http://vitabench.github.io
💻 Code: https://github.com/meituan-longcat/vitabench
🤗 Dataset: https://huggingface.co/datasets/meituan-longcat/VitaBench
This media is not supported in your browser
VIEW IN TELEGRAM
Неожиданный поворот: облачный провайдер Cloud.ru запустил телемагазин с комиком Ильей Макаровым.

Этот контраст между юмором и технологиями работает отлично: Илья просто и понятно объясняет, как запускать передовые AI-сценарии: с помощью AI анализировать данные и автоматизировать процессы, даже если вы не техлид.

Cloud.ru доказывает, что их сервисы — это действительно просто и удобно.

Узнайте, как про AI рассказывают с шутками (и без багов)

Реклама. ООО «Облачные технологии», ИНН: 7736279160. Erid: 2W5zFHrkSfS. 0+
👎2😁21🔥1
⚡️ FlyCut Caption — это React-компонент для распознавания речи и редактирования субтитров в видео.

🔍 Главное
- Локальное распознавание речи на базе Whisper
- Визуальное редактирование и синхронный предпросмотр
- Экспорт в SRT / JSON
- Кастомизация стилей и поддержка разных языков

👉 Репозиторий: https://github.com/x007xyz/flycut-caption
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Machinelearning
🧠 Андрей Карпаты научил nanochat считать буквы - и объяснил, как расширять способности модели.

Карпаты показал, как добавить новую функцию в мини-LLM nanochat d32, чьи размеры он сравнил с «мозгом пчелы».

Он обучил модель считать, сколько раз буква r встречается в слове strawberry - и использовал этот пример, чтобы показать, как можно наделять маленькие языковые модели новыми навыками через синтетические задачи.

Он использует задачу SpellingBee, которая генерирует диалоги вида:
> «Сколько букв r в слове strawberry?»
и правильные ответы.

После этого модель дообучается (**SFT**) или проходит обучение с подкреплением (RL), чтобы закрепить навык.

Далее модель проходит дообучение (SFT) или обучение с подкреплением (RL), чтобы закрепить навык.

Карпаты объясняет, что для маленьких моделей важно продумывать всё до мелочей, как разнообразить запросы, как устроена токенизация и даже где ставить пробелы.

Он показывает, что рассуждения лучше разбивать на несколько шагов, тогда модель легче «понимает» задачу.

Nanochat решает задачу двумя способами:
логически, рассуждая пошагово,
— и через встроенный Python-интерпретатор, выполняя вычисления прямо внутри чата.

🧩 Идея в том, что даже крошечные LLM можно «научить думать», если правильно подготовить примеры и синтетические данные.

📘 Полный разбор: github.com/karpathy/nanochat/discussions/164

@ai_machinelearning_big_data

#AI #Karpathy #Nanochat #LLM #SFT #RL #MachineLearning #OpenSource
🔥2
2025/10/25 07:01:00
Back to Top
HTML Embed Code: