Telegram Web
Forwarded from Machinelearning
🌟 OpenCoder - модели для кодинга, cookbook обучения и датасеты.

OpenCoder - это открытое и воспроизводимое семейство LLM для программирования, включающее 1,5B и 8B базовые и instruct версии, поддерживающее английский и китайский языки.

Семейство моделей OpenCoder обучалось с нуля на 2,5 трлн. лексем, состоящих на 90 % из сырого кода и на 10 % из веб-данных, связанных с кодом, и прошло отладку на более чем 4,5 млн. высококачественных примеров SFT, в итоге достигнув производительности топовых LLM с похожей специализацией.

В открытый доступ опубликованы не только веса моделей и код для инференса, но и датасеты, полный цикл обработки данных, результаты экспериментальной абляции и подробные протоколы обучения.

OpenCoder тщательно протестирован с помощью исследований абляции на различных стратегиях очистки данных и процессах обучения, включая эксперименты по дедупликации на уровне файлов и репозиториев, что обеспечило семейству тщательную проверку производительности моделей.

OpenCoder достигает высокой производительности в различных бенчмарках, что ставит их в ряд SOTA-моделей с открытым исходным кодом для задач программирования.

▶️ Семейство моделей OpenCoder :

🟢OpenCoder-1.5B-Base, 4 тыс. токенов контекста;

🟢OpenCoder-8B-Base, 8 тыс. токенов контекста;

🟠OpenCoder-1.5B-Instruct, 4 тыс. токенов контекста;

🟠OpenCoder-8B-Instruct, 8 тыс. токенов контекста;

▶️ Датасеты:

🟢OpenCoder-SFT-Stage1, 4.21 млн. строк;

🟠OpenCoder-SFT-Stage2, 375 тыс.строк.


▶️ Пример инференса на HF Transformers:

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "infly/OpenCoder-8B-Instruct"
model = AutoModelForCausalLM.from_pretrained(model_name,
torch_dtype=torch.bfloat16,
device_map="auto",
trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

messages=[
{ 'role': 'user', 'content': "write a quick sort algorithm in python."}
]

inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")

outputs = model.generate(inputs, max_new_tokens=512, do_sample=False)

result = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)



🟡Страница проекта
🟡Набор моделей
🟡Arxiv
🟡Набор датасетов
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #LLM #OpenCoder #Datasets
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла крутая нейронка для кодинга — Qwen2.5-Coder-32B-Instruct. Модель выложили в открытый доступ, её можно скачать и пользоваться бесплатно.

По многим параметрам она круче ChatGPT-4. Причина этому — масштабное обучение модели на 5,2 триллионах токенов, в то время как GPT-4o — лишь на сотнях миллиардов.

Забираем имбу — тут.

@techmedia
Новое открытие в сфере ИИ - это адаптивные модели Lora для проекта FLUX, доступные на платформе Hugging Face: ссылка на модели 🌐.

За полгода существования FLUX, сообществом было обучено и загружено более 7500 моделей. Несмотря на то, что часть из них может не оправдать ожиданий и содержать ненадлежащий контент, впечатляет сам объём работы и вклада сообщества 🤖.

Оцените разнообразие и примите участие в развитии этой области!
🚀 Недавно вышло более мощное семейство моделей YandexGPT 4 🌟: улучшенное качество ответов, работа с длинным контекстом и пошаговое рассуждение. Подробнее читайте здесь: Habr.

🔍 Что нового?

- 📜 Длинный контекст: YandexGPT 4 Pro теперь обрабатывает до 32 тысяч токенов вместо прежних 8 тысяч. Это значит, что модель лучше разбирается в сложных запросах и может анализировать до 60 страниц текста!

- 🌐 Работа с внешними источниками: Снижение галлюцинаций в RAG-сценариях и повышение надежности ответов. В 67% случаев YandexGPT 4 Pro превосходит предыдущее поколение в RAG-задачах.

- 🎓 Эффективность обучения: Использование библиотеки YaFSDP от Яндекса помогает проводить эксперименты быстрее и качественнее, улучшая все стадии машинного обучения.

- 🧠 Скрытые рассуждения: Модели обучены пошагово анализировать задачи и выводить ключевые этапы решения. Это особенно полезно для математики и научных исследований, где требуется глубокий анализ.

- 🛠 Режим вызова функций: В ближайшее время планируем добавить возможность вызова функций для создания умных ассистентов с применением внешних инструментов и API. Разработчики смогут задавать параметры, а клиенты использователи сгенерированные функции. Полноценный запуск будет чуть позже, после тестирования.

Можно попробовать улучшенную функциональность в облаке! 🌥️
🤖 НейроСинтез: Погружаемся в мир ИИ!

🎯 Всё о нейросетях простыми словами
💡 Лайфхаки и секреты работы с искусственным интеллектом
🎨 Крутые фишки для творчества, бизнеса и повседневных задач
Только полезные и понятные инструкции без сложных терминов

🔥 Разбираем популярные нейросети и новинки AI-мира
🎁 Делимся готовыми промтами и проверенными настройками
🚀 Показываем, как автоматизировать рутину с помощью ИИ
💪 Учимся использовать нейросети на максимум

👉 Подписывайся - будет интересно и полезно! ⚡️

https://www.tgoop.com/gptnovostii
🔎 Открой для себя мир промптов! 📚 Библиотека промптов для ChatGPT содержит сотни проверенных запросов для разных задач и профессий. 🚀

🌟 Что внутри?
🔹 Задания для домашнего обучения
🔹 Инструменты для маркетинга
🔹 Решения для разработки

⚡️ Библиотека постоянно обновляется, чтобы вы могли использовать самые свежие идеи и решения. Доступ ко всему этому богатству вы найдёте по ссылке - Нейрон.

💾 Сохраняйте и пользуйтесь на здоровье!
​​🎥 Исследуй мир видеогенерации с Mochi 1 от Genmo! 🚀 Это опенсорс-инструмент, который превращает ваши текстовые подсказки в видеоролики длительностью до 5 секунд с частотой 30 FPS и разрешением 480p. Фотореализм и чёткость движений делают каждый ролик настоящим произведением искусства. 📽

🌐 Как это работает?
🔹 Отличное понимание промптов
🔹 Высокая чёткость движений

🛠 На сайте можно зарегистрироваться и создавать до 2 видео в день. Не упустите шанс попробовать: Genmo.

🔗 Дополнительные ресурсы:
- GitHub: Исходный код
- Hugging Face: Модель

Погрузитесь в творчество и создайте уникальные видео вместе с Mochi 1! 🌟
Forwarded from MIL Team Partners
Привет! ⚡️
Зовем вас на Научный семинар «AI-кодеки: технологии, перспективы, вызовы»

5 декабря в 📍МФТИ собираемся обсудить, как нейросети перевернули мир сжатия видео и изображений:
– Путь развития технологий от истоков до SOTA, диффузии, random access
– Разбираем реальные кейсы и вызовы.
– Ловим инсайты от лучших экспертов!

Подробности – в карточках

🗓Когда: 5 декабря, 18:00

Регистрация до 4 декабря 15:00 на TimePad
Ссылка на запись и трансляцию будет в нашем канале @mil_team_partners. Вопросы – там же
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
​​🚀 Новинка от Stability: Stable Diffusion 3.5 Medium! 🤖

🤩 Основные преимущества:
1. Компактность: Модель такого же размера, как SDXL, и подходит для 10 ГБ VRAM, а с оптимизациями — даже для 8 ГБ! Ознакомьтесь с уже оптимизированной версией здесь: Hugging Face.
2. Скорость: В 3–4 раза быстрее, чем Stable Diffusion 3.5 Large, при этом качество остается на высоте.

🎨 Другие плюсы:
- Лицензия: Настоящее открытие!
- Разрешение: Поддержка до 2 мегапикселей (1440x1440).
- Гибкость в обучении: Проста в настройке и поддерживает предсказуемую тренировку. Надеемся на улучшенные файнтюны для еще лучшего понимания промптов благодаря enhanced MMDiT-X!

🔍 Читайте больше: Comfy

🎯 Где попробовать:
- Попробуйте сами тут: Hugging Face Space
- Ознакомьтесь с моделью подробно: Модель на Hugging Face
- Academic: Архив
- Исходный код: GitHub

🔥 Для всех, кто ищет мощные технологии без H100! 👀 💡 Время протестировать!
​​🔧 Prefect.io: Airflow, адаптированный для ML! 🤖
Мощный оркестратор, который сделает ваш MLOps проект ещё проще и эффективнее. 🚀 Prefect сочетает в себе все преимущества, такие как планирование на основе Cron и повторные попытки, но при этом предлагает безсерверную инфраструктуру и облачный UI интерфейс. ☁️

💡 Почему Prefect?
- Есть условно бесплатный тариф.
- Удобный облачный UI.
- Простой переход на ML оркестрацию.
Подробнее о сравнении с Airflow: Prefect vs. Airflow.

👨‍💻 Ресурсы:
- GitHub репозиторий с более чем 17K звёздами: GitHub
- Изучите применение на практике: Case Study

🎥 Быстрое введение: Узнайте, как превратить ваш Python скрипт в конвейер данных за 4 минуты. Подключение к Prefect Cloud, создание потоков, добавление задач и планирование: Введение в оркестрацию.

Начните прямо сейчас, зарегистрировав бесплатный аккаунт: Prefect Cloud.
Стимпанк-дирижабль и опасные викторианские девушки в короткометражном видео, созданном с помощью искусственного интеллекта - «Механические сумерки».
Стимпанк, который мы заслужили.
https://youtu.be/tqo0GBYHCVg?si=-wDF555eHC_hVpQf
🎤 Создай свою AI-певицу: музыка и клипы с нуля! 🎶

В этом видео вы узнаете, как создать уникальную AI-модель для вокала, написать музыку, анимировать рендеры и собрать всё это в стильный музыкальный клип. 🎬

🎛 Инструменты для творчества:
- 🔧 Генератор промптов: AI Photo Sales
- 🎨 Рендеринг: Rendernet
- 🔄 AI-музыка: Flux
- 🎵 Музыкальная платформа: Suno
- 🖌 Анимация и визуализация: Kling

🎥 Стоковые видео для ваших проектов:
1. 📹 UnlimVideos: AppSumo
2. 💻 Canva: Canva

Откройте для себя возможности AI в создании музыки и видеоконтента! 🌟
2025/02/05 22:45:34
Back to Top
HTML Embed Code: