Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on value of type null in /var/www/tgoop/function.php on line 65
- Telegram Web
Telegram Web
Коллеги из MTS AI анонсировали митап "AI4SE: Искусственный Интеллект для Разработки Программного Обеспечения". Доклады выглядят интересно.

Дата: 29 октября
Время: 19:00
Место: Офис MTS AI, м. Курская

Онлайн тоже будет. Программа ниже:
Forwarded from Code Mining (Alexey Smirnov)
Опубликована программа митапа
"AI4SE: Искусственный Интеллект для Разработки Программного Обеспечения"

18:00 — 18:40: Валентин Малых — "Как мы делаем помощника программиста"

18:40 — 19:20: Алексей Смирнов — "Применение ML в задачах безопасной разработки"

Перерыв: 20 минут

19:40 — 20:20: Павел Плюснин — "Predictive test selection: ускоряем тестирование в десятки раз с помощью ML"

20:20 — 21:00: Дмитрий Пилецкий — "In IDE Code Retriever. RAG для кода, для AI ассистентов и тд"

21:00 — Саморганизовываемся на автопати в один из баров Москвы)

Регистрация на оффлайн здесь (онлайн тоже будет):
https://mts-ai-2024.timepad.ru/event/3019734/
Научный опенсорс
Лучший доклад
В суровом противостоянии победил доклад Терещенко Владислава про LLM-ассистента Edulytica.

Поздравляем!
Всем доброго дня!
Мы добавили таймкоды к записи митапа, поэтому теперь посмотреть понравившийся доклад ещё проще.

0:00 Николай Никитин — Опенсорс в ИТМО

28:47 Кирилл Колпаков — Национальная open source экосистема Китая

51:11 Юлия Борисова — Свернули-развернули: TorchCNNBuilder для прикладных задач

1:05:15 Терещенко Владислав — Edulytica: LLM-ассистент для проверки научных работ.

1:22:36 Дмитрий Варенов — OpenScaler OS - передовые открытые технологии из Китая

1:51:29 Иван Жарский — VGLib: Библиотека по обработке и генерации векторной графики

2:17:17 Иван Усов, Никита Кулин, Симар Муратов — Gamac: Автоматическая кластеризация на GPU

Презентации с митапа выложили в нашем репозитории.
Сегодня на Yandex Open Source Jam буду рассказывать про опыт нашего недавнего аналитического исследования про "Использование ML/Data Open Source в России". Очная регистрация уже закрыта, ссылку на трансляцию выложат на сайте ближе к началу (15-00 мск), плюс ютуб - https://www.youtube.com/live/rssnqgCOkY4.

Чтобы было ещё интереснее - подготовили про него расширенный пост на Хабр для блога ИТМО:
https://habr.com/ru/companies/spbifmo/articles/851088/

В посте - некоторые дополнения к исследованию, например - детализированные выводы, идеи по решению обсуждавшихся проблем и улучшению самого исследования. Также расширили экспертную часть - например, пригласили дать свои комментарии Александра Белоцерковского, технологического евангелиста GitVerse/СберТеха.

Слушайте, читайте, комментируйте, накидывайте идей на следующие исследования)
Мероприятие необычного формата от коллег из Яндекса. Выглядит довольно интересно, сам тоже постараюсь посетить, если буду в Москве.
Forwarded from Yandex for Developers
Please open Telegram to view this post
VIEW IN TELEGRAM
Продолжая рубрику анонсов интересных мероприятий, расскажу ещё и о хакатоне от сообщества @phystech_genesis, тематика которого тоже связана с опенсорсом:

Хакатон Т1 2024 пройдет в Cанкт-Петербурге 15-18.11 (в гибридном формате, дедлайн на регистрацию - 13 ноября)

Треки :
- Разработка open-source WAF (Web Application Firewall), обеспечивающего максимальную защиту от различных видов инъекций;
- Разработка инструмента для оценки спринтов и анализа задач в Agile-командах.

Призы за первую тройку мест - 180к/130к/90к соответственно.

Регистрация по ссылке - https://impulse.t1.ru/hackathons/saint_petersburg_2024

Заинтересовавшися есть смысл посмотреть и другие хакатоны из их канала - например, любопытно выглядит задача "Code Review с помощью ИИ" от EВРАЗ-а.
Сделали ещё одну подборку актуальных мероприятий, которые пройдут в ближайшее время:

1) Хакатон от ЕВРАЗа - https://хакатоневраза.рф - с 29 ноября по 1 декабря 2024, формат гибридный.

Предлагают попробовать создать ИИ-чатбота для анализа программного кода на соответствие стандартам (автоматизация code review). Использовать предлагается LLM вместе с RAG. Языки - Python, TypeScript или C#.

Призовой фонд: 250-150-100к за первые три места.

2) Хакатон от Норникеля - https://nornickel-hackathon.ru/ - с 6 по 8 декабря, онлайн.

Предлагают решить задачи ИИ в промышленности по одному из трех треков: оптимизация параметров установки для обогащения руды, определение загрязненности линз камер, анализ документации.

Призовой фонд - 250-150-100к за первые три места в каждом из треков.

3) Конференция RustCon - http://rustcon.ru - 6 декабря 2024, Москва

Конференция по Rust, доклады - в том числе про опенсорсные и ML-решения на этом языке.
Для студентов предлагают скидку на билеты - 5000 вместо 24000 рублей, для первых десяти зарегистрировавшихся.
Недавно писали про конкурс КОД-ИИ-7, а вот и результаты подъехали - https://fasie.ru/press/fund/kod-ai-7-results/.

8 проектов поддержано, 4 в неопределенном статусе. Меньше, чем в прошлом году - конкурс выше 1:10.

Поздравления всем кто прошел, остальным удачи в следующий раз)
Мы много рассказываем про свои проекты, связанные с центром ИИ, но вообще в ИТМО довольно много интересного опенсорса и у других подразделений и лабораторий.

Поэтому решили сделать небольшую подборку тематических разделов. В качестве затравки - 10 github-организаций:

1) aimclub - объединение открытых ИИ-инструментов за авторством сообщества AIM Университета ИТМО.
Ссылки: сайт.
Примеры проектов: FEDOT, BAMT, GOLEM, GEFEST, rostok, iOpt.

2) itmo-nss-team - R&D-проекты NSS Lab в области ИИ
Ссылки: сайт, tg, youtube, colab.
Примеры проектов: EPDE, torch_DE_solver.

3) Industrial-AI-Research-Lab - проекты лаборатории промышленного ИИ.
Примеры проектов: rec4u.

4) AI-chem - проекты центра "ИИ в Химии".
Примеры проектов: GEMCODE, Nanomaterial_Morphology_Prediction.
Ссылки: сайт, tg.

5) BE2RLAB - проекты лаборатории биомехатроники и энергоэффективной робототехники.
Примеры проектов: OpenSemanticMapping

6) airalab - проекты лаборатории мультиагентных систем в умных городах и индустрии 4.0.
Примеры проектов: robonomics.
Ссылки: сайт.

7) swarmtronics - проекты лаборатории посвящены моделированию роев, состоящих из простых роботов, способных к самоорганизации и выполнению сложных задач.
Примеры проектов: AMPy, swarmodroid
Ссылки: сайт.

8) СTLab-ITMO и CTLab (старый репозиторий) - проекты учебно-научной лаборатории компьютерных технологий .
Примеры проектов: fgsea, GADMA, samovar, metafast, VGLib.
Ссылки: tg.

9) LISA-ITMO - проекты учебно-научной лаборатории LISA
Примеры проектов: edylytica.
Ссылки: tg.

10) ITMO-MMRM-lab - проекты из области биологии от лаборатории MMRM.

Наверняка про кого-то не знаем, поэтому если владеете информацией - пишите в комментарии.
На открытой конференции ИСП РАН сейчас проходит секция "Российский open source: разработка библиотек в сфере ИИ" (по проектам, поддержанным ФСИ - это КОД-ИИ, например)

Трансляция для интересующихся тут - https://www.isprasopen.ru или в ВК.
Конкретная секция - в разделе "Лекторий Кинетика", выступления будут до 19-00. Программа и трансляции остальных секций - по той же ссылке.

Часть докладчиков есть в нашем чате.
В последние дни было много новостей про релизы open-source моделей различного масштаба, нацеленных на русский язык - собрал небольшую подборку:

1. T-Lite и T-Pro – открытые русскоязычные опенсорс-модели (7B, 32B)

"T-Lite — небольшая и эффективная в инференсе модель с отличными метриками, ее можно использовать для базовых задач или файнтюнинга на целевую задачу.
T-Pro подойдет для решения более широкого класса задач в промптинге или для решения более сложных задач в режиме файнтюнинга, где модели меньшего размера не справляются."

https://habr.com/ru/companies/tbank/articles/865582/

2. Сбер выкладывает GigaChat Lite в открытый доступ (20B)

"- GigaChat-20B-A3B - первая открытая MoE модель в России. В мировой практике мало кому в мире удается обучать MoE архитектуры с хорошим качеством.
- GigaChat обучен преимущественно на русском языке, поэтому не совершает грамматических и пунктуационных ошибок и не переключается на другие языки во время разговора
- В GigaChat-20B-A3B дешевый инференс сочетается с хорошими показателями метрик
- Модель отлично подходит для исследований, например, концентрации"

https://habr.com/en/companies/sberdevices/articles/865996/

3. Meno-Tiny-0.1 от "Сибирских нейросетей" (1.5B)

"Основная цель Meno-Tiny - быть частью RAG-пайплайна, решая такие задачи, как ответы на вопросы по релевантным документам, абстрактивная саммаризация, разрешение анафоры в пользовательских вопросах, определение токсичности, детоксификация и другие задачи"

https://www.tgoop.com/dialoger_tech/179

Дополняйте, если что-то свеженькое пропустил.
По мотивам моего летнего выступления на SaintHighload++ 2024 коллеги из блога ИТМО сегодня выпустили пост с расширенной текстовой версией:

"Почему мы топим за открытый код в науке ― несколько слов о воспроизводимости результатов научных исследований",
https://habr.com/ru/companies/spbifmo/articles/867236.

Добавил в текст подробностей, также постарались учесть некоторые замечания из чата. Любые дополнения - приветствуются)
Минутка саморекламы: вчера неожиданно получил "звезду GitVerse" в номинации "за развитие opensource в науке".

Награждение состоялась в Москве на мероприятии GitVerse All Stars. Формат необычный - "звезды" в нескольких номинациях вручали управляющий директор СберТеха Анатолий Шипов и космонавт Денис Матвеев. Помимо награждений, рассказывали и о новых возможностях платформы.

Спасибо организаторам из gitverse.ru - призы это всегда приятно, плюс удалось увидеться вживую с несколькими активными участниками нашего чата)
Можно начать понедельник с лонгрида:

Дмитрий Кабанов опубликовал на Хабре пост "Этот год в open source", в котором собраны мнения экспертов о ключевых событиях, корпоративном прогрессе и развитии open source в России в 2024-м, а также ожиданиях на 2k25.

Я тоже немного поучаствовал - в части обсуждения перспектив опенсорса в науке и роли ИИ-инструментов в его развитии.

Обсудить публикацию и задать вопросы Дмитрию можно в комментариях поста на Хабре или прямо тут - он есть в нашем чате.
Вышел в паблик ещё один совместный проект Лаборатории ИИ Сбера и ИТМО - библиотека RIDE (новость, описание).

RIDE позволяет повысить производительность логистических расчётов произвольного масштаба от городского до регионального или масштаба целой страны за счет сокращения время на поиск кратчайшего пути на графе. В основе подхода лежит идея кластеризации графа. Благодаря ей RIDE существенно сокращает область поиска решения и заранее исключает неоптимальные варианты маршрутов. В итоге на больших графах результат достигается до 30 раз быстрее относительно базовых алгоритмов. Реализация сделана на Python.

Отзывы и звездочки как всегда приветствуются - https://github.com/sb-ai-lab/Ride.

Это не первый наш совместный проект - например, недавно в чате писали про библиотеку для федеративного обучения stalactite.
Коллеги из "Базальт СПО" и ИПС РАН анонсировали XX-ю конференцию "Свободное программное обеспечение в высшей школе" (OSEDUCONF-2025) - https://www.basealt.ru/20edu-conf.

Состоится 7-9 февраля 2025 года в Институте программных систем РАН в Переславле-Залесском Ярославской области.
Заявки на доклады - до 12 января.

Тематики заявлены такие:

"- Использование свободного ПО в учебном процессе: разработка, внедрение, преподавание.
- Научные проекты, связанные с разработкой и использованием свободного программного обеспечения.
- Внедрение СПО в инфраструктуру образовательной организации: проблемы и решения.
- Социальные и экономико-правовые особенности применения свободного программного обеспечения в высшей школе.
- Студенческие проекты разработки СПО.

"Доклады принимаются только по тематике свободного ПО. Доклады о бизнесе, рекламные и о проприетарном ПО запрещены. Если тема доклада связана с разработкой ПО, заявка должна содержать ссылку на сам код, опубликованный в любом общедоступном репозитории под любой свободной лицензией."

Наш опыт с этой конференцией вполне позитивный: мероприятие интересное и содержательное, позволяет пересечься с довольно разнообразным срезом опенсорсных движений, существующих в России. От нас в прошлом году был доклад Андрея Гетманова про опенсорс-сообщество ИТМО. Нетворкинг тоже оказался довольно полезен - например, узнали о опенсорс-сообществе коллег из ФКН ВШЭ. Плюс необычная локация, конечно)
Узнал тут о интересном международном сообществе https://www.pyopensci.org. Его фокус - поддержка открытых инструментов для обработки научных данных, реализованных на Python.
Базируются, судя по всему, в Сан-Франциско.

- Самое интересное: предлагается опция peer-review опенсорсных проектов. При этом ревью потом зачитывается в открытом Journal of Open Source Software.
Cами ревью делаются на гитхабе, их можно посмотреть.

- Также есть довольно обширные руководства по тому как создавать научные пакеты.

- Организуют виртуальные мероприятия в духе "фестивалей открытой науки".

- В блоге тоже всякое интересное пишут. Например, размышляют про свою финансовую модель.

В общем, выглядит очень достойно и полезно. Если кто-то попробует туда что-то закинуть на ревью или как-то ещё поучаствует - поделитесь потом своим опытом.
2024/12/28 07:22:56
Back to Top
HTML Embed Code: