Привет, меня зовут Николай Пирогов, я руковожу Deploy Platform в Yandex Infrastructure. Моя команда развивает внутреннее облако, в котором живут все сервисы Яндекса: Поиск, Такси, Музыка и другие.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Подводим итоги программы поддержки независимых разработчиков от Yandex Open Source. Нам прислали 120 проектов в трёх категориях: обработка и хранение данных, машинное обучение и разработка. Забавный и поучительный факт: один участник отправил заявку 15 марта в 23:59 — в последнюю минуту подачи. И победил!
В ML-треке награды получили:
Это фреймворк для оценки и сравнения возможностей Vision Language Models в распознавании документов на русском. Проект пригодится как исследователям, так и бизнесу: его можно использовать для автоматизации документооборота.
Это инструмент, который ускоряет процесс COCO-валидации на задачах с тысячами объектов на одном изображении в 3 раза для стандартных задач и больше чем в 10 раз для сложных случаев.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Вы можете подписаться на ежемесячную email-рассылку, в которой не будет ничего лишнего. Только материалы по машинному обучению и искусственному интеллекту от тех, кто на практике занимается ими в Яндексе.
Для вас наши инженеры мониторят интернет и делятся тем, что читают сами. В результате получаются лаконичные подборки статей на Хабре, подкастов и видео, новостей индустрии и полезных инструментов. А ещё самых важных мероприятий и технологических анонсов Яндекса.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Поговорим о главных темах и значимых выступлениях с международной конференции, которая проходила в конце апреля в Сингапуре.
Смотрите трансляцию:
• YouTube
• VK Видео
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Мы применили подход LLM-as-a-judge, в котором сама языковая модель оценивает качество генераций и сравнивает между собой разные варианты описаний без участия ручной разметки и асессоров.
Полем для эксперимента стал генератор описаний для Pull Request’ов, которым мы пользуемся в Яндексе. Он призван упростить жизнь разработчикам: автоматически формировать понятные и информативные саммари для всех изменений в коде.
В основе решения лежит русскоязычная LLM на 7 миллиардов параметров. А работа состояла из 5 этапов:
В процессе оптимизации промпта мы выявили несколько интересных закономерностей:
Какие выводы мы сделали из проделанной работы:
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Совсем скоро будем обсуждать роботов-доставщиков, автономный транспорт, умные устройства и серверную инфраструктуру. Выбирайте трек, который вам ближе, и подключайтесь в 12:00.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Уже сейчас начинается трансляция трека Practical ML от Яндекса.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Ребята опубликовали программу главной конференции Яндекса по инфраструктуре. Спикерами на infra.conf’25 станут ведущие инженеры и разработчики Яндекса, Купер.тех, MTS Web Services, Positive Technologies, Авито, Sber AI и других компаний.
В программе 18 докладов. Вот только часть из них:
И это далеко не все доклады. А помимо них, гостей конференции ждут IT stand-up и воркшопы по пайке и сварке оптоволокна.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Привет, это Даня Ткаченко, я руковожу ML в Лавке и преподаю в Школе анализа данных. По образованию я математик, а путь в IT начинал с кода на M и портирования плюсовых библиотек на разные Linux и Unix (в том числе на «Эльбрус»). В карточках расскажу, как пришёл из математики в ML и как помогаю в этом другим.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследователи Яндекса выложили в опенсорс YaMBDa — датасет на 4,79 миллиарда событий. Это один из крупнейших в мире датасетов для развития рекомендаций. Мы открываем эти данные, потому что хотим уменьшить разрыв между академическими исследователями, разработчиками опенсорса и бизнесом.
YaMBDa создан на основе обезличенных данных Яндекс Музыки, крупнейшего подписного музыкального сервиса в России, а также «Моей волны», главного рекомендательного продукта сервиса.
Что интересного есть в датасете:
Мы выпустили три версии датасета: на 5 миллиардов, 500 миллионов и 50 миллионов событий. Скачать данные можно на Hugging Face, а код для оценки замеров лежит на GitHub.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Приглашаем выступить 12 сентября в Москве на «Ночи музеев» в мире IT. Одновременно пять российских компаний откроют двери своих офисов и покажут IT-специалистам, как, где и кем создаются технологии для миллионов пользователей. Коллаборацию придумали в Яндексе, а соорганизаторами стали Сбер, X5, Т-Банк и Lamoda.
Мы ждём спикеров, которые готовы поделиться экспертизой и прочитать хардовые технологические доклады.
Подписывайтесь:
Please open Telegram to view this post
VIEW IN TELEGRAM