Neural Networks | Нейронные сети 791

🌟 OpenCoder - модели для кодинга, cookbook обучения и датасеты.

OpenCoder - это открытое и воспроизводимое семейство LLM для программирования, включающее 1,5B и 8B базовые и instruct версии, поддерживающее английский и китайский языки.

Семейство моделей OpenCoder обучалось с нуля на 2,5 трлн. лексем, состоящих на 90 % из сырого кода и на 10 % из веб-данных, связанных с кодом, и прошло отладку на более чем 4,5 млн. высококачественных примеров SFT, в итоге достигнув производительности топовых LLM с похожей специализацией.

В открытый доступ опубликованы не только веса моделей и код для инференса, но и датасеты, полный цикл обработки данных, результаты экспериментальной абляции и подробные протоколы обучения.

OpenCoder тщательно протестирован с помощью исследований абляции на различных стратегиях очистки данных и процессах обучения, включая эксперименты по дедупликации на уровне файлов и репозиториев, что обеспечило семейству тщательную проверку производительности моделей.

OpenCoder достигает высокой производительности в различных бенчмарках, что ставит их в ряд SOTA-моделей с открытым исходным кодом для задач программирования.

▶️ Семейство моделей OpenCoder :

🟢

OpenCoder-1.5B-Base, 4 тыс. токенов контекста;

🟢

OpenCoder-8B-Base, 8 тыс. токенов контекста;

🟠

OpenCoder-1.5B-Instruct, 4 тыс. токенов контекста;

🟠

OpenCoder-8B-Instruct, 8 тыс. токенов контекста;

▶️ Датасеты:

🟢

OpenCoder-SFT-Stage1, 4.21 млн. строк;

🟠

OpenCoder-SFT-Stage2, 375 тыс.строк.

▶️ Пример инференса на HF Transformers:

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

model_name = "infly/OpenCoder-8B-Instruct"
model = AutoModelForCausalLM.from_pretrained(model_name,
                                             torch_dtype=torch.bfloat16,
                                             device_map="auto",
                                             trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

messages=[
    { 'role': 'user', 'content': "write a quick sort algorithm in python."}
]

inputs = tokenizer.apply_chat_template(messages, add_generation_prompt=True, return_tensors="pt")

outputs = model.generate(inputs, max_new_tokens=512, do_sample=False)

result = tokenizer.decode(outputs[0][len(inputs[0]):], skip_special_tokens=True)

🟡

🟡

🟡

🟡

🖥

GitHub

@ai_machinelearning_big_data

#AI #ML #LLM #OpenCoder #Datasets

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

312 views11:45

Neural Networks | Нейронные сети

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

Вышла крутая нейронка для кодинга — Qwen2.5-Coder-32B-Instruct. Модель выложили в открытый доступ, её можно скачать и пользоваться бесплатно.

По многим параметрам она круче ChatGPT-4. Причина этому — масштабное обучение модели на 5,2 триллионах токенов, в то время как GPT-4o — лишь на сотнях миллиардов.

Забираем имбу — тут.

@techmedia

400 views06:00

Neural Networks | Нейронные сети

Новое открытие в сфере ИИ - это адаптивные модели Lora для проекта FLUX, доступные на платформе Hugging Face: ссылка на модели 🌐.

За полгода существования FLUX, сообществом было обучено и загружено более 7500 моделей. Несмотря на то, что часть из них может не оправдать ожиданий и содержать ненадлежащий контент, впечатляет сам объём работы и вклада сообщества 🤖.

Оцените разнообразие и примите участие в развитии этой области!

huggingface.co

Models - Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

274 views06:00

Neural Networks | Нейронные сети

🚀 Недавно вышло более мощное семейство моделей YandexGPT 4 🌟: улучшенное качество ответов, работа с длинным контекстом и пошаговое рассуждение. Подробнее читайте здесь: Habr.

🔍 Что нового?

- 📜 Длинный контекст: YandexGPT 4 Pro теперь обрабатывает до 32 тысяч токенов вместо прежних 8 тысяч. Это значит, что модель лучше разбирается в сложных запросах и может анализировать до 60 страниц текста!

- 🌐 Работа с внешними источниками: Снижение галлюцинаций в RAG-сценариях и повышение надежности ответов. В 67% случаев YandexGPT 4 Pro превосходит предыдущее поколение в RAG-задачах.

- 🎓 Эффективность обучения: Использование библиотеки YaFSDP от Яндекса помогает проводить эксперименты быстрее и качественнее, улучшая все стадии машинного обучения.

- 🧠 Скрытые рассуждения: Модели обучены пошагово анализировать задачи и выводить ключевые этапы решения. Это особенно полезно для математики и научных исследований, где требуется глубокий анализ.

- 🛠 Режим вызова функций: В ближайшее время планируем добавить возможность вызова функций для создания умных ассистентов с применением внешних инструментов и API. Разработчики смогут задавать параметры, а клиенты использователи сгенерированные функции. Полноценный запуск будет чуть позже, после тестирования.

Можно попробовать улучшенную функциональность в облаке! 🌥️✨

Хабр

Более мощное семейство моделей YandexGPT 4: рост качества ответов, длинный контекст, пошаговые рассуждения

Сегодня мы открываем доступ к четвёртому поколению наших больших языковых моделей: более мощная YandexGPT 4 Pro и облегчённая YandexGPT 4 Lite уже доступны через API в Yandex...

264 views06:00

Neural Networks | Нейронные сети

🤖 НейроСинтез: Погружаемся в мир ИИ!

🎯 Всё о нейросетях простыми словами
💡 Лайфхаки и секреты работы с искусственным интеллектом
🎨 Крутые фишки для творчества, бизнеса и повседневных задач
✨ Только полезные и понятные инструкции без сложных терминов

🔥 Разбираем популярные нейросети и новинки AI-мира
🎁 Делимся готовыми промтами и проверенными настройками
🚀 Показываем, как автоматизировать рутину с помощью ИИ
💪 Учимся использовать нейросети на максимум

👉 Подписывайся - будет интересно и полезно! ⚡️

https://www.tgoop.com/gptnovostii

❤1

287 views06:00

Neural Networks | Нейронные сети

🔎 Открой для себя мир промптов! 📚 Библиотека промптов для ChatGPT содержит сотни проверенных запросов для разных задач и профессий. 🚀

🌟 Что внутри?
🔹 Задания для домашнего обучения
🔹 Инструменты для маркетинга
🔹 Решения для разработки

⚡️ Библиотека постоянно обновляется, чтобы вы могли использовать самые свежие идеи и решения. Доступ ко всему этому богатству вы найдёте по ссылке - Нейрон.

💾 Сохраняйте и пользуйтесь на здоровье!

Нейрон

Практика и наглядный опыт из мира ИИ и IT

Формируем нейронные связи у наших читателей

Наш ChatGPT бот - @neuron_gptbot

246 views06:00

Neural Networks | Нейронные сети

🎥 Исследуй мир видеогенерации с Mochi 1 от Genmo! 🚀 Это опенсорс-инструмент, который превращает ваши текстовые подсказки в видеоролики длительностью до 5 секунд с частотой 30 FPS и разрешением 480p. Фотореализм и чёткость движений делают каждый ролик настоящим произведением искусства. 📽

🌐 Как это работает?
🔹 Отличное понимание промптов
🔹 Высокая чёткость движений

🛠 На сайте можно зарегистрироваться и создавать до 2 видео в день. Не упустите шанс попробовать: Genmo.

🔗 Дополнительные ресурсы:
- GitHub: Исходный код
- Hugging Face: Модель

Погрузитесь в творчество и создайте уникальные видео вместе с Mochi 1! 🌟

YouTube

happy dog swims on giant wave

257 views06:00

Neural Networks | Нейронные сети

Forwarded from MIL Team | Community

Привет! ⚡️
Зовем вас на Научный семинар «AI-кодеки: технологии, перспективы, вызовы»

5 декабря в 📍МФТИ собираемся обсудить, как нейросети перевернули мир сжатия видео и изображений:
– Путь развития технологий от истоков до SOTA, диффузии, random access
– Разбираем реальные кейсы и вызовы.
– Ловим инсайты от лучших экспертов!

Подробности – в карточках

🗓Когда: 5 декабря, 18:00

Регистрация до 4 декабря 15:00 на TimePad
Ссылка на запись и трансляцию будет в нашем канале @mil_team_partners. Вопросы – там же

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

252 views06:04

Neural Networks | Нейронные сети

Neural Networks | Нейронные сети pinned a photo

06:07

Neural Networks | Нейронные сети

🚀 Новинка от Stability: Stable Diffusion 3.5 Medium! 🤖

🤩 Основные преимущества:
1. Компактность: Модель такого же размера, как SDXL, и подходит для 10 ГБ VRAM, а с оптимизациями — даже для 8 ГБ! Ознакомьтесь с уже оптимизированной версией здесь: Hugging Face.
2. Скорость: В 3–4 раза быстрее, чем Stable Diffusion 3.5 Large, при этом качество остается на высоте.

🎨 Другие плюсы:
- Лицензия: Настоящее открытие!
- Разрешение: Поддержка до 2 мегапикселей (1440x1440).
- Гибкость в обучении: Проста в настройке и поддерживает предсказуемую тренировку. Надеемся на улучшенные файнтюны для еще лучшего понимания промптов благодаря enhanced MMDiT-X!

🔍 Читайте больше: Comfy

🎯 Где попробовать:
- Попробуйте сами тут: Hugging Face Space
- Ознакомьтесь с моделью подробно: Модель на Hugging Face
- Academic: Архив
- Исходный код: GitHub

🔥 Для всех, кто ищет мощные технологии без H100! 👀 💡 Время протестировать!

280 views06:00

Neural Networks | Нейронные сети

🔧 Prefect.io: Airflow, адаптированный для ML! 🤖
Мощный оркестратор, который сделает ваш MLOps проект ещё проще и эффективнее. 🚀 Prefect сочетает в себе все преимущества, такие как планирование на основе Cron и повторные попытки, но при этом предлагает безсерверную инфраструктуру и облачный UI интерфейс. ☁️

💡 Почему Prefect?
- Есть условно бесплатный тариф.
- Удобный облачный UI.
- Простой переход на ML оркестрацию.
Подробнее о сравнении с Airflow: Prefect vs. Airflow.

👨‍💻 Ресурсы:
- GitHub репозиторий с более чем 17K звёздами: GitHub
- Изучите применение на практике: Case Study

🎥 Быстрое введение: Узнайте, как превратить ваш Python скрипт в конвейер данных за 4 минуты. Подключение к Prefect Cloud, создание потоков, добавление задач и планирование: Введение в оркестрацию.

Начните прямо сейчас, зарегистрировав бесплатный аккаунт: Prefect Cloud.

YouTube

Getting Started with Workflow Orchestration

In this 4 minute introduction to workflow orchestration, learn how to turn your Python script into a scheduled, reliable data pipeline with Prefect. This video covers connecting to Prefect Cloud, building flows and adding tasks, and assigning infrastructure…

302 views06:00

Neural Networks | Нейронные сети

Стимпанк-дирижабль и опасные викторианские девушки в короткометражном видео, созданном с помощью искусственного интеллекта - «Механические сумерки».
Стимпанк, который мы заслужили.
https://youtu.be/tqo0GBYHCVg?si=-wDF555eHC_hVpQf

YouTube

Mechanical Dusk | Steampunk AI Girls short film

Steampunk airships and dangerous Victorian Steampunk Girls in short AI video "Mechanical Dusk". If you like steampunk aesthetics and steampunk music, and you're not indifferent to AI girls - this video should appeal to you : )

292 views18:45

Neural Networks | Нейронные сети

🎤 Создай свою AI-певицу: музыка и клипы с нуля! 🎶

В этом видео вы узнаете, как создать уникальную AI-модель для вокала, написать музыку, анимировать рендеры и собрать всё это в стильный музыкальный клип. 🎬

🎛 Инструменты для творчества:
- 🔧 Генератор промптов: AI Photo Sales
- 🎨 Рендеринг: Rendernet
- 🔄 AI-музыка: Flux
- 🎵 Музыкальная платформа: Suno
- 🖌 Анимация и визуализация: Kling

🎥 Стоковые видео для ваших проектов:
1. 📹 UnlimVideos: AppSumo
2. 💻 Canva: Canva

Откройте для себя возможности AI в создании музыки и видеоконтента! 🌟

YouTube

Как создать свою AI-певицу, написать ей музыку и снять клип

В этом видео я покажу как создать свою AI модель, написать музызку, анимировать рендеры и смонтировать вместе в музыкальные клипы.

Курс по стокам: https://aiphotosales.com/
✔️ Аффилиатка и АИшка в Telegram: https://www.tgoop.com/aiseosales

Генератор промптов - …

279 views06:00

2025/07/10 06:44:28
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>