Telegram Web
А вот и решение задачки с прошлогодней соревы
2
🚀 Разбираем решение, которое принесло нашей команде 6-е место в Kaggle-соревновании по обработке данных миссии Ariel

Пост про то, что это вообще за сорева вот тут.

Мы работали с частотными сигналами, которые изначально были очень шумными. Для их сглаживания использовали:
1️⃣
Гауссовский регрессор
2️⃣
Фильтр Савицкого-Голея

Далее ищем границы транзитной зоны планеты. Делаем через простой эмпирический детектор: транзит на графике светимости звезды имеет вид \_/ — яркость падает, когда планета проходит перед звездой, так как часть частотных компонентов теряет интенсивность.

📉 Что мы делали дальше:
Удаляем этапы до и после транзита, чтобы анализировать только изменения светимости в нужный момент.
"Поднимаем" транзит обратно к уровню светимости звезды, чтобы восстановить исходный "пульс звезды". Это важно, чтобы учесть глобальное поведение светимости звезды, которе не очень-то и постоянное.

🔍 Фичи и модели:

На основе изменений яркости между ожидаемыми и наблюдаемыми значениями на заданных частотах извлекали фичи. Эти частоты совпадают с важными таргетами — спектрограммой атмосферы экзопланеты.
Обучаем линейную регрессию глобально для каждого таргета, подбирая оптимальные коэффициенты. В смысле берем все моменты времени для всех транзитов и конкретной частоты и ищем коэффициент подгонки.

Параллельно обучаем CNN, которая анализировала частотные изменения в заданных временных окнах.
Это:
Помогает учитывало локальные особенности спектра и переходов (энергии?) между частотами
Позволяло понять взаимосвязи между соседними частотами, улучшая точность предсказаний.
🔗 Финал:


Смешали (блендили) результаты линейной регрессии и CNN. Затем финальную спектрограмму еще раз сгладили, чтобы убрать артефакты.

💡 Бонус материал: пример 'подъема' спектра на картинке
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84🔥2
Together AI и Agentica team потюнили Qwen3-32B и опенсурсят DeepSWE-Preview агента для разработки
Тюнили с GRPO++ (GRPO с улучшалками из некоторых недавних статей) своей либы https://github.com/agentica-project/rllm

Самое крутое что все дают - веса, датасет, код ну и пайплайн описывают
В датасете данные на использование тулов вызов bash, поиск, файл едитор

https://www.together.ai/blog/deepswe

блог про RLLM
https://pretty-radio-b75.notion.site/rLLM-A-Framework-for-Post-Training-Language-Agents-21b81902c146819db63cd98a54ba5f31

веса
https://huggingface.co/agentica-org/DeepSWE-Preview

датасет на 4.5к семплов
https://huggingface.co/datasets/R2E-Gym/R2E-Gym-Subset

PS проектики делаем и ИИнфу собираем в https://www.tgoop.com/researchim
👍64
Сегодня я доказал что мы живем в симуляции
Клод Сонет 4 доделал некоторые важные штучки за o3, на которые тот не обращал внимания
Вагон смайликов также был отгружен в код
🪳🪳🪳
Please open Telegram to view this post
VIEW IN TELEGRAM
😁23🆒6👍3💩1💊1
из SSI уволился Даниэль Гросс (я на самом деле хз кто это)
А Илья теперь гендир SSI
У них есть вычислительная техника кстати.

https://x.com/ilyasut/status/1940802278979690613
😁11🥴4👍21
жесть модельки деграднули за 5 лет
😁11🥰6👍1🤔1
Челики которые недавно ллмный RL туда-сюда гоняли, пруверы тренили
щас запустили агента https://www.kimi.com/
РЛьные (пусть и ллмные) делают стартапы и рвутся к бабкам, это хорошо

https://moonshotai.github.io/Kimi-Researcher/

PS а мы проекты делаем и ИИнфу собираем в https://www.tgoop.com/researchim
👍42
Короче ребятки, если вы на ютубе в шортсах видели как Владимир Сурдин и Алексей Семихатов разговаривают за всякое науковое, но при этом не могли найти ориг, то это канал https://www.youtube.com/@vselennayaplus
Я вот сам только что нашел

Не то что не мог найти ориг, просто щас впервые решил его найти
👍142🔥1💩1
Есть такая головоломка "Баба - это ты" (эххехех)
https://store.steampowered.com/app/736260/Baba_Is_You/
Как я понял там на уровнях есть блоки с которыми надо взаимодействовать (толкать, останавливать, управлять им, победить) чтобы этот уровень пройти до конца. От разных блоков правила мира могут меняться.
По отзывам в стиме ощущается что игра людям заходит и кажется довольно сложной

Выглядит как бенчмарк.
Подключили к ней Клод 4 по MCP.
Клод смог пройти 0 уровень. Как я понимаю там надо было 8 раз направо двинуться.
А больше ничего не смог
Конец

https://fi-le.net/baba/
15😁9
Челы собрали мультиагентного бота для генерации cuda кернелов. Пишут что хорошо получилось

Один агент кернелы писал, другой компилил, третий дебагал

Бота не дают. Кернелы дают
https://github.com/Lossfunk/Flash-Kernels

Почитать
https://letters.lossfunk.com/p/how-many-agents-does-it-take-to-beat
12👍1
Есть такой проект https://github.com/vosen/ZLUDA
Там челы переносят CUDA на другие гпушки

Я про них чот давно не слышал, думал заглохли.
А оказывается что живы, у них команда удвоилась недавно + начали работу по переносу PhysX

Но пока еще там активная разработка и вряд ли что-то полезное будет работать.
Но было интересно узнать что проект живет

https://vosen.github.io/ZLUDA/blog/zluda-update-q2-2025/
👍134🔥1
Хм. Соглы.
Го все виброкодировать RL среды
Уже давно этим занимаюсь

Виброкодируем тут https://www.tgoop.com/researchim
🤣24👍41👎1
Челы из Allen AI сделали бенчмарк по саенсу
Пишешь запрос, там внутри достается контекст из релевантных статеек и по нему моделька отвечает пользователю

Дипсик R1 0528 на 4 месте, хорошая (а главное опенсурсная) моделька
o3 из тестируемых лучшая, тут понятно

https://allenai.org/blog/sciarena

лидерборд
https://sciarena.allen.ai/

Код евала
https://github.com/yale-nlp/SciArena

Данные
https://huggingface.co/datasets/yale-nlp/SciArena

Можно и самим вопросики позадавать и пооценивать
👍3
Кстати тоже все хотел сделать как-нить подборку РЛ челов и стартапов. Все руки не дойдут

Пока можно тут почитать
https://www.chemistry.vc/post/rl-reigns-supreme

Из тех что выше вижу часто мелькают Thinking Machines и OpenPipe

PS высвобождаем и делаем потихоньку в https://www.tgoop.com/researchim
🔥42
HF выложили thinking модельку SmolLM3-3B и рассказывают как тюнили. Русского в языках нету

https://huggingface.co/HuggingFaceTB/SmolLM3-3B

https://huggingface.co/blog/smollm3

Думаю самое интересное это почитать про сам трен
🔥7
2025/07/09 15:02:23
Back to Top
HTML Embed Code: