Telegram Web
🦠 Как писать код так, чтобы open-source проект рос сам по себе (как колония бактерий)

Неожиданный, но полезный принцип: код стоит писать как бактерии пишут ДНК.
Звучит странно, но у природы за миллиарды лет выработался стиль, который идеально подходит для быстрого роста и масштабирования. И он отлично ложится на open-source.

Что делает "бактериальный код" особенным:

– Он маленький — потому что каждая строка «стоит энергии»
– Он модульный — код разбит на независимые блоки (как опероны в генах)
– Он самодостаточный — кусок кода можно просто скопировать и вставить в другой проект, без зависимостей

Теперь представьте, что ваш код читают как библиотеку сниппетов.
Можно ли выдернуть одну функцию — и она сразу принесёт пользу?
Можно ли вставить ваш класс в чужой проект — и он просто заработает?

Если да, значит код "бактериальный" — и это хорошо.

Почему это работает:
Такой код легко распространяется, переиспользуется, адаптируется. Люди могут взять только нужное, не вникая в архитектуру всего проекта. И это ключ к живому open-source: когда код «живет отдельно от автора».

Теперь про монорепы.
Сложные проекты всё равно требуют структуры — как организм требует согласованной работы органов.
Это уже стиль "эукариот" — более крупный, связанный, менее гибкий, но подходящий для системного масштаба.

Вывод:
Хочешь сложную платформу — строй "монорепу".
Хочешь, чтобы твой open-source проект рос, развивался и жил без тебя — пиши код как бактерии:
маленько, модульно, автономно, копируемо.

Это стиль, который колонизировал всё: от термальных источников до вакуума в космосе. И он работает.

▶️ Оригинал пост от Karpathy

#opensource #кодстиль #cleanCode #dev #community #softwaredesign
Please open Telegram to view this post
VIEW IN TELEGRAM
16👍3🔥3
🚀Kafka must-have инструмент для современных проектов MLOps!

Присоединяйся к вебинару и узнай, как настроить Kafka для обработки потоковых данных и интегрировать её в MLOps-проекты. Вебинар проходит в рамках подписки на курсы OTUS, которая даёт возможность приобрести 3 курса по цене одного.

🔑 Что будет:
— Практическое и теоретическое руководство по настройке Kafka в Docker и взаимодействию с ней через Python.
— Обзор инструментов для работы с Kafka: поднятие UI-интерфейса и управление потоками данных.
— Примеры использования Kafka для связи микросервисов и обзор ключевых функций, делающих её незаменимой брокером сообщений.
— Как использовать Kafka в MLOps: сбор данных для ML-моделей, мониторинг их работы и интеграция предсказаний в реальном времени.

🚀Регистрация по ссылке - https://otus.pw/18rU/
Подробнее о подписке OTUS - https://otus.pw/SMQu/

👉 Запишись сейчас, количество мест ограничено!
5👍2
🧬 Чат-боты ИИ в 5 раз повысили шанс создания биооружия.
Риск глобальной пандемии вырос с 0.3% до 1.5%.

Исследователи показали: топовые ИИ помогают обойти сложные лабораторные этапы и дают точные инструкции, которые раньше были доступны только экспертам.
Теперь даже непрофессионалы могут собрать опасный вирус.

🔒 Что делать:

1. ИИ должен отказываться отвечать на опасные запросы, быть устойчивым к джейлбрейкам и не распространяться в открытом виде без ограничений.
2. Лаборатории обязаны проверять заказы на синтетические гены и подтверждать личности клиентов.

Если внедрить эти меры — риск почти вернётся к прежнему уровню.
Учёные призывают внедрять такие правила до, а не после кризиса.

📌 Подробнее
9👍6🔥4😴2🤔1
📊 AI4TS — энциклопедия по анализу временных рядов с помощью ИИ. Этот масштабный GitHub-репозиторий собрал всё, что нужно для работы с временными рядами: от свежих исследований с NeurIPS и ICML до практических руководств по аномалиям и прогнозированию.

Автор не просто перечисляет публикации, а структурирует их по годам, конференциям и задачам — будь то классификация, обнаружение аномалий или прогнозирование. Проект включает не только PDF-статьи, но и ссылки на официальные реализации моделей вроде Time-LLM или iTransformer. Раздел с обзорными работами помогает быстро погрузиться в тему, например, через сравнение методов на основе трансформеров или графовых нейросетей.

🤖 GitHub

@machinelearning_interview
🔥8👍6🥰21
This media is not supported in your browser
VIEW IN TELEGRAM
NLP-специалисты, три главных слова для вас — One Day Offer!

12 июля сразу три команды Сбера станут на несколько талантливых коллег больше: AI Solutions для Управления Благосостоянием, блок Стратегии и развития в Москве, а также Центр перспективных AI-разработок в индустриях в Сочи.

Если и вы хотите обучать большие языковые модели, создавать агентные и мультиагентные системы и заниматься другими масштабными проектами — регистрируйтесь на One Day Offer по ссылке.

Ждём встречи и уже готовим для вас рабочее место! 😉
🔥3
📚 Awesome-Pytorch-list — исчерпывающая коллекция ресурсов вокруг PyTorch. В этом репозитории собраны сотни инструментов, туториалов и реализаций статей, связанных с PyTorch. Проект охватывает все направления: от компьютерного зрения и NLP до гауссовских процессов и рекомендательных систем.

Особенно полезен раздел с готовыми имплементациями моделей вроде BERT, Tacotron и OpenNMT. Репозиторий включает как популярные проекты, так и нишевые решения для задач вроде coreference resolution и speaker diarization.

🤖 GitHub

@machinelearning_interview
8👍4🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
🖼️ JarvisArt — ИИ, который редактирует фото как профессионал, просто по текстовому описанию.

Никаких слайдеров, кривых и масок — задаем промыт, что нужно («сделай свет мягче», «винтажный стиль», «удали шум»), и JarvisArt делает всё сам. Причём не наугад, а точно так, как это сделал бы человек с опытом в Lightroom.

💡 Что под капотом:
- Мультимодальная LLM, натренированная на 55 000 реальных ретушей
- Управление 200+ инструментами Lightroom через текст
- Интеграция со Stable Diffusion для генерации и обработки изображений
- Точность и качество выше GPT-4o по специальной бенчмарке MMArt‑Bench

📦 Всё в опенсорсе, есть демо и облегчённая версия для запуска в Colab:

🔗 Project: https://jarvisart.vercel.app
🔗 GitHub: https://github.com/LYL1015/JarvisArt
8👍6🔥4
🧪 Google выпустили MatFormer Lab для Gemma 3n — лабораторию кастомных LLM

Google запустила MatFormer Lab — инструмент для кастомизации моделей Gemma 3n на базе архитектуры MatFormer.

🔧 Что позволяет Lab:
- Использовать технологию Mix-n-Match для создания собственной модели
- Разрезать базовую E4B и собрать версию с эффективным размером от 2B до 4B параметров
- Исследовать компромисс между качеством и масштабом
- Делиться кастомными моделями с сообществом

💡 MatFormer — это модульный подход, где каждый компонент может быть адаптирован под конкретные цели: от лёгких inference‑моделей до более точных решений для RAG, ассистентов и т.д.

🔗 Попробовать: http://goo.gle/gemma3n-matformer-lab
👍83🔥3🥰1
Крутейший релиз от Anthropic — парни выпустили собственные бесплатные курсы!

Вы нижете десятки лекций, тесты и даже сертификаты по различным темам: от Anthropic API до MCP и лучших практик Claude Code. Всё с реальными примерами от разработчиков.

Забираем здесь.
👍10🔥4🥰3🤣2
Forwarded from Machinelearning
Media is too big
VIEW IN TELEGRAM
✔️ Северная Корея будет развивать собственный ИИ.

Власти КНДР объявили о реформе системы образования, в рамках которой в ведущих университетах страны создаются новые специальности, связанные с искусственным интеллектом. Согласно официальной партийной газете «Нодон синмун», это нужно для подготовки талантов, необходимых для «требований времени».

Этот шаг подтверждает давний интерес страны к передовым технологиям. Исследовательский институт ИИ при Университете имени Ким Ир Сена уже заявил о цели «использовать технологию GPT для замены умственного труда человека». Ранее сообщалось об использовании в институте американского ChatGPT, а научные издания страны посвящали спецвыпуски этой технологии. Аналитики полагают, что Пхеньян намерен применять ИИ не только для технологического развития, но и для укрепления государственного контроля и в разведывательной деятельности.
Lianhe Zaobao

✔️OpenAI выпустит свой браузер.

OpenAI готовится в течение нескольких недель запустить собственный веб-браузер с глубокой интеграцией искусственного интеллекта. Новый продукт будет построен на Chromium, но предложит уникальные функции: встроенное окно для общения в стиле ChatGPT и поддержку ИИ-агентов. Эти агенты смогут автономно выполнять задачи пользователей, от бронирования отелей до заполнения онлайн-форм.

Ключевая идея состоит в удержании пользователя внутри интерфейса браузера, а не перенаправлять на внешние сайты. как это происходит сейчаc в ChatGPT. Если OpenAI удастся привлечь хотя бы часть из 500 миллионов еженедельных пользователей ChatGPT, это может серьезно пошатнуть рекламную бизнес-модель Google, которая во многом опирается на данные, собираемые через Chrome.
reuters.com

✔️ NovelAI выложила в открытый доступ веса своей модели Diffusion Anime V2.

Модель генерации изображений в стиле аниме основана на Stable Diffusion 1.5, генерирует в разрешении до 1024x1024 пикселей и использует предпоследний слой энкодера CLIP.

Diffusion Anime V2 распространяется под двойной лицензией, которая допускает только некоммерческое использование с обязательным указанием авторства. NovelAI напоминает, что V2 является устаревшей версией, а все новые модели остаются проприетарными и эксклюзивными для их веб-сервиса. Веса Diffusion Anime V2 доступны на Hugging Face.
blog.novelai.net

✔️ YouTube обновит правила монетизации для борьбы с ИИ-контентом.

С 15 июля YouTube вводит более строгие правила для своей партнерской программы, нацеленные на борьбу с массово создаваемыми и повторяющимися видео. Это ответ сервиса на рост генеративных ИИ-инструментов, которые значительно упрощают производство подобного контента.

Хотя представители платформы называют это «незначительным обновлением» и утверждают, что такой контент и раньше не подлежал монетизации, новые правила вносят больше ясности. Ужесточение рассматривается как превентивная мера для защиты YouTube от наплыва низкокачественных видео, способных нанести ущерб репутации и ценности платформы.
techcrunch.com

✔️ Google заменяет Assistant на Gemini в умных часах с Wear OS.

Google начала развертывание своего ИИ-ассистента Gemini на умных часах, заменяя Google Assistant на носимых устройствах. Обновление уже доступно для Pixel Watch и в ближайшие недели появится на моделях от Samsung, OPPO, OnePlus, Xiaomi и других производителей под управлением Wear OS 4 или новее.

Новый ассистент на часах поддерживает текстовые, голосовые и графические запросы. Активировать Gemini можно привычной командой «Hey Google» или долгим нажатием боковой кнопки. Благодаря глубокой интеграции с сервисами Google, пользователи смогут выполнять многошаговые команды прямо с запястья: просить создать плейлист в YouTube Music или кратко изложить содержание последних писем в Gmail.

Вместе с этим, компания улучшила функцию визуального поиска Circle to Search, добавив в нее специальный "AI Mode" для получения контекстной информации. Улучшение доступно пока только для США и Индии на Android и iOS.
9to5google.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥2🥰2
🧠 Phi-4-mini-flash-reasoning —новая компактная модель от Microsoft с мощной математической логикой

Модель Phi-4-mini-flash-reasoning — это часть семейства Phi‑4 от Microsoft. Она специально создана для глубокого математического мышления, при этом остаётся лёгкой, быстрой и экономной по ресурсам.

🔍 Что делает её особенной

- Модель на 3.8B параметров, но приближается по качеству к 7B–8B аналогам.
- Контекст до 64K токенов — идеально для задач с длинной цепочкой логики.
- Оптимизирована под математику: подходит для доказательств, символьных вычислений, задач с несколькими шагами и сложных текстовых задач.

🚀 Достижения:

| Модель | AIME24 | AIME25 | Math500 | GPQA |
|----------------------------------|--------|--------|---------|------|
| Phi-4-mini-**Flash**-Reasoning | **52.29** | **33.59** | **92.45** | **45.08** |
| Phi-4-mini-Reasoning | 48.13 | 31.77 | 91.20 | 44.51 |
| DeepSeek-R1-Qwen-1.5B | 29.58 | 20.78 | 84.50 | 37.69 |
| DeepSeek-R1-LLaMA-8B | 43.96 | 27.34 | 87.48 | 45.83 |
| Bespoke-Stratos-7B | 21.51 | 18.28 | 80.73 | 38.51 |


📈 *Модель превосходит другие по точности, несмотря на компактный размер.*


⚙️ Производительность

- Модель построена на гибридной архитектуре decoder + SSM, что даёт:
- модель способна генерировать длинные ответы примерно в 10 раз быстрее, чем её базовая версия
- почти линейный рост задержки (в отличие от квадратичного у обычных моделей)
- Тестировалась на A100-80GB, без tensor parallelism.

📌 *Идеальна для мобильных устройств и приложений с ограниченными ресурсами.*
⚠️ На что стоит обратить внимание

- Оптимизирована только под математическое мышление, не предназначена для общего NLP.
- Из-за размера ограничена в фактических знаниях — желательно использовать с поиском или RAG.

Phi-4-mini-flash-reasoning — это пример того, как небольшая модель может быть очень умной, если её правильно обучить и оптимизировать под конкретные задачи.

📌 Модель: https://huggingface.co/microsoft/Phi-4-mini-flash-reasoning

Подпишись: @machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍5🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
Эндрю Ын (Andrew Ng) считает, что шумиха вокруг AGI (искусственного общего интеллекта) сильно преувеличена — люди ещё долго будут играть важную роль.

💡 Главное — не создавать ИИ с нуля, а уметь заставить компьютер делать то, что нужно именно вам с его помощью.

🧰 Не обязательно самому разрабатывать инструменты — достаточно научиться ими пользоваться.

📈 В будущем те, кто умеет работать с ИИ, будут гораздо сильнее и эффективнее тех, кто не умеет.
22👍7🔥2
E-CUP возвращается. Реальные данные. Масштабные проекты. Большие призы

Решайте ML-задачи в стиле Ozon Tech и узнайте, как работают ML-инженеры в e-com бигтехе. Девять победителей разделят призовой фонд — 7 200 000 рублей 🔥

🗓 Регистрация: https://cnrlink.com/ecup25mlinterview
💻 Формат участия: онлайн
👥 Команда: от 1 до 5 человек
🎯 Для кого: Data Scientists, ML-специалисты, аналитики данных, дата-инженеры, специалисты Big Data и разработчики, которые интересуются ML/DS.

Что вас ждёт:
🔹 Работа над проектом для миллионов пользователей на основе данных от ведущего e-com в России.
🔹 Обмен опытом с экспертами Ozon Tech.
🔹 Питчинг — 13 сентября на конференции E-CODE. Ozon Tech предоставит финалистам билеты и оплатит поездку.

Каждый трек E-CUP — реальная e-com задача, как в настоящей продуктовой ML-команде.
1️⃣ Рекомендации: предсказание следующей покупки пользователя
2️⃣ Логистика: автопланирование курьеров
3️⃣ Контроль качества: автоматическое выявление поддельных товаров

Регистрация на платформе Codenrock: https://cnrlink.com/ecup25mlinterview
Please open Telegram to view this post
VIEW IN TELEGRAM
3
📄 Хотите, чтобы резюме работало на вас? Teal — нейросеть, которая поможет выделиться даже на фоне кандидатов уровня FAANG

Что делает Teal:

Подгоняет резюме под вакансии — анализирует описание должностей и ключевые слова, чтобы предложить точные и релевантные формулировки.

Готовит к интервью — на основе анализа вакансии предлагает вопросы и советы, как подать себя максимально убедительно.

Удобный интерфейс — онлайн-конструктор с шаблонами + возможность импортировать профиль из LinkedIn.

Если вы хотите, чтобы ваше резюме действительно заметили — начните с правильного инструмента.

http://tealhq.com/

@machinelearning_interview
👍73🔥3
2025/07/13 08:17:04
Back to Top
HTML Embed Code: