Generative Ai

Продолжаем линию маленьких моделей, Microsoft анонсировал phi-2

https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/

We are now releasing Phi-2, a 2.7 billion-parameter language model that demonstrates outstanding reasoning and language understanding capabilities, showcasing state-of-the-art performance among base language models with less than 13 billion parameters. On complex benchmarks Phi-2 matches or outperforms models up to 25x larger, thanks to new innovations in model scaling and training data curation.

Microsoft Research

Phi-2: The surprising power of small language models

Phi-2 is now accessible on the Azure model catalog. Its compact size and new innovations in model scaling and training data curation make it ideal for exploration around mechanistic interpretability, safety improvements, and fine-tuning experimentation on…

❤1👍1🔥1

1.04K views18:46

Generative Ai

Forwarded from Derp Learning

А вот такое мы любим.

X-adapter для подключения controlnet, lora от 1.5 к сдохле

Код

За наводку спасибо a s
@derplearning

1.02K views21:59

Generative Ai

Forwarded from Derp Learning

This media is not supported in your browser

VIEW IN TELEGRAM

MLC LLM - универсальный кросплатформенный GPU-accelerated фреймворк для LLM

Да, 7b модели можно спокойно крутить на телефоне.

git
blog
ios app
android app
desktop (win/linux/mac)
in-browser

@derplearning

1.12K views22:02

Generative Ai

Forwarded from • Dmitry Legchikov

Классный визуализатор внутренностей больших языковых моделей (LLM).

Если решили разобраться в LLM или повторить основы перед собеседованием - такие инструменты must have.
Можно наглядно отследить процесс от подачи токенов до генерации выходного текста.
Где какие матрицы умножаются, что творится внутри Attention, вплоть до умножения каждой ячейки.

На сайте доступно несколько моделей:
nano-gpt (85,584 параметра), GPT-2 (small), GPT-2 (XL), GPT-3.

Еще есть крутое видео от Андрея Карпатого, где он с нуля пишет nano-gpt на чистом питоне.

На русском языке, на мой взгляд лучше объяснение Attention механизма от @seeallochnaya в этом видео.

bbycroft.net

LLM Visualization

A 3D animated visualization of an LLM with a walkthrough.

😁3👍1

1.24K views23:22

Generative Ai

Forwarded from Stable Diffusion | Text2img

Очередной (🙊) релиз от компании StabilityAI. На этот раз - генератор 3D-объектов из картинки.
Релиз основан на базе другого генератора - Zero123. Чекпоинт дообучен на датасете из 800.000 3D объектов. По сути ничего нового, конечно, просто хорошая база NERF и качественный набор исходников. Поставить на локальный ПК это можно уже сейчас, но Стабильные (как всегда) просят от 24 гигабайт VRAM для его нормальной работы.

Блог о релизе — https://stability.ai/news/stable-zero123-3d-generation
Веса и инструкция по запуску — https://huggingface.co/stabilityai/stable-zero123

Обсудить / пообщаться
Наш чат @text2image

1.16K views16:15

Generative Ai

Forwarded from Градиент обреченный (Sergei Averkiev)

🔺 Новые открытые LLM #ml_news

Пришло время обозреть открытые языковые модели, вышедшие за последнее время.

➕ Mixtral-8x7B

Новая модель от французского стартапа Mistral. Обучили модель подходом MoE (Mixture of Experts), при котором небольшая часть модели является роутером, а остальная часть состоит из N «экспертов», из которых активируется только часть.

Здесь таких частей 8, то есть суммарный вес модели ~ 45B параметров, но вычислений при инференсе столько же, как у 14B модели (активируется топ-2 «эксперта»).

Благодаря этому, Mixtral превосходит Llama 70B на большинстве бенчмарков, работая в 6 раз быстрее. На днях выложили и инструктивную версию.

HF | GitHub

➕ Phi-2

Продолжение экспериментов с малыми моделями от Microsoft. На этот раз модель стала больше — 2.7B. Идея, напомню, в обучении модели в основном на синтетических данных, тщательно подготовленных. Объем данных сравнительно небольшой — 1.4B токенов за ~5 эпох.

На многих тестах Phi-2 показывает себя лучше чем модели размером 13B, а в некоторых случаях, типа кода, лучше Llama 70B. Также на всех тестах лучше Gemini Nano 2 (3.2B). MMLU — 56,7.

HF | релиз

➕ Zephyr 3B

И новая модель от StableLM, которую обучили на открытых датасетах и выровняли при помощи DPO. Ребята провели замеры на MT-Bench (тесты в которых в роли судьи играет другая LLM) и получили неплохие результаты, кое-где догоняя ChatGPT 3.5. На MMLU получили 46.3.

Поигрался с Zephyr'ом, на английском понравилось, на русском очень слабо.

> Describe unexisted Martian language like in Wikipedia article

> An extinct Martian language, also known as an extinct extraterrestrial language, was an ancient linguistic system used by the hypothetical intelligent, now extinct,
Martian civilization that once inhabited the Red Planet.

1. Language family: ...

HF | релиз

🔥4😁2👍1🥰1

1.5K views16:17

Generative Ai

Forwarded from Агенты ИИ | AGI_and_RL

У DeepMind вышла статья, как с помощью LLM строить алгоритмы решающие математические задачи:

https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/

Сама генерации решений строится как эволюционный проецесс, добавляя решения в базу и оценивая их. Пользователь может запросить лучшее решение в любой момент.
Испытали на некоторых открытых задачах из разных областей математики и смогли построить решения, которые лучше прежде известных. (в некоторых случаях)
Один из плюсов в том, что решения - программы легко интерпретировать.

Пока так понял :)

Код: https://github.com/google-deepmind/funsearch

Статья

Google DeepMind

FunSearch: Making new discoveries in mathematical sciences using Large Language Models

We introduce FunSearch, a method for searching for “functions” written in computer code, and find new solutions in mathematics and computer science. FunSearch works by pairing a pre-trained LLM,...

🔥3👍2

1.89K views21:00

Generative Ai

🤓 OpenAI представили официальное руководство по написанию промптов.

Самые нужные лайфхаки в одном месте: как задать длину ответа, привести примеры, получить нужный формат и т.д.

Работает с VPN.

• Сохраняем тут

👍5🤮1

1.83K views05:21

Generative Ai

Топ - нейронок 2023

Ведущие искусственные нейронные сети для создания изображений, видеороликов, аудиозаписей, текстов и других полезных инструментов доступны легко и без лишних сложностей.

ИИ-Чат-боты

Falcon — простейшее решение для диалога. Зайдите на сайт и начните общение.

CharacterAI — позволяет создать собственного ИИ-помощника, который можно тренировать и адаптировать под личные или рабочие нужды.

Perplexity — не только поисковая система, но и чат-бот, обладающий высоким уровнем интеллекта и функциональностью, включая последнюю версию ChatGPT.

Генерация изображений с помощью ИИ

Ideogram — разработка бывших сотрудников Google, предлагает удобный интерфейс для создания изображений после простой авторизации через Google.

KREA — основной тренд конца 2023 года, позволяет генерировать изображения в реальном времени, отлично подходит для индивидуального или семейного творчества.

Fast Stable Diffusion XL— это выдающаяся версия Stable Diffusion, обеспечивающая максимальную скорость и качество. Просто введите запрос и получите результаты.

Генерация видео с помощью ИИ

SuperDuperAI - регистрируйтесь и приступайте к созданию видео. Это перспективный продукт, который пока в стадии тестирования и доступен бесплатно. Управление осуществляется через чат.

Genmo — многофункциональный инструмент с акцентом на видео, доступен бесплатно и стоит внимания.

Runway — предлагает регистрацию для создания видео с множеством функций. Начальные кредиты ограничены, далее услуги платные.

Генерация музыки с помощью ИИ

Riffusion — отличная возможность для создания музыки и сопутствующего видеоряда, идеально подходит для создания контента для TikTok, YouTube Shorts и Instagram Reels.

Suno — идеальный выбор для начала работы с музыкальной генерацией. Этот инструмент обеспечивает впечатляющие результаты.

Stable Audio — развивающийся музыкальный генератор от компании Stability, заслуживает внимания.

Другие полезные нейронные сети

Silero TTS — для генерации голоса с обширной базой различных дикторов и персонажей.

Neo Prompt — «кнопка красоты», помощник-промпт, который преобразит любой ваш запрос в привлекательный результат без необходимости обладать специальными навыками.

PixelBin — множество инструментов для ежедневных задач: улучшение качества фото, удаление фона, удаление водяных знаков и многое другое.

С какими вы уже знакомы? Если есть что добавить в список, пишите в комментариях 🤝

@deeplearning_ru

👍8❤2

1.95K viewsedited 12:05

Generative Ai

0:45

This media is not supported in your browser

VIEW IN TELEGRAM

Оказалось, что ChatGPT прекрасно понимает всю боль мужчин при температуре 37 градусов.

Интересно, что он сделает про женщин 🤔

🔥3

1.73K views05:29

Generative Ai

Forwarded from эйай ньюз

This media is not supported in your browser

VIEW IN TELEGRAM

Самая мощная LLM в опесорсе, Mixtral 8x7B MoE от Mistral AI, теперь доступна во фреймворке Сandle* - с поддержкой квантизации. За счет квантизации модели могут работать локально на ноутбуке с 32 GB RAM.

Например, 4-битная Mixtral 8x7B MoE занимает всего 26.44GB памяти. Тогда как в bf16 на GPU модель бы заняла 112+ GB VRAM (то есть влезла бы только на H100).

*Candle - это минималистский ML-фреймворк для Rust, сфокусированный на производительности (включая поддержку GPU) и простоте использования.

- Поддерживает 2-bit, 3-bit, 4-bit, 5-bit, 6-bit and 8-bit int квантизованные модели в gguf and ggml форматах.
- SIMD оптимизации для Apple Silicon и x86.

Вот тут можете попробовать демки разных моделей на Candle:
- Whisper, [пост в канале]
- LLaMa-2, [пост в канале]
- T5,
- YOLOv8,
- Segment Anything [пост в канале]

@ai_newz

🔥3👍1

1.75K views15:00

Generative Ai

Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation

https://humanaigc.github.io/animate-anyone/

1.71K views21:18

Generative Ai

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Дримувинг - анимация людей от Алибабы или Video ControlNet.

Алибаба серьезно вваливается на рынок генераторов контента.
Вот смотрите, что они опять выкатили.
DreaMoving: A Human Video Generation Framework based on Diffusion Models

Там внутри Video ControlNet для управления движением и Content Guider для сохранения идентичности. Можно самим попробовать и даже развести локально.
На входе одно фото.

Информация и все ссылки тут: https://dreamoving.github.io/dreamoving/
Демо на попробовать тут: https://huggingface.co/spaces/jiayong/Dreamoving
И обязательно поглядите вот этот твиттор, там очень много примеров использования:
https://twitter.com/heybarsee/status/1741106778849300900

❤5🔥1

2.15K views21:36

Generative Ai

1:11

This media is not supported in your browser

VIEW IN TELEGRAM

OpenVoice: Instantly clone any voice and generate speech in any style and any language!

https://research.myshell.ai/open-voice
https://github.com/myshell-ai/OpenVoice

👍6👎1

2.29K viewsedited 08:46

Generative Ai

imaginAIry - консольная утилита для генерация изображений и видео!

https://github.com/brycedrennan/imaginAIry

👍6🔥3🤮1

2.01K views13:52

Generative Ai

Forwarded from AI для Всех (Artemii)

🚀 Keynote: Следующее поколения ИИ для разработчиков

На докладе был продемонстрирован ряд новых интересных инструментов для работы с искусственным интеллектом и облачными вычислениями, что подчеркивает стремление компании интегрировать искусственный интеллект в свои основные сервисы.

- Microsoft Cloud и Copilot Stack: Интеграция искусственного интеллекта в каждое облачное решение, преобразующее работу разработчиков с Azure, которая теперь предлагает платформу для приложений, данных и искусственного интеллекта.

- Copilot для Microsoft 365: Использование больших языковых моделей (LLM) OpenAI и Microsoft Graph, обеспечивающих улучшенный пользовательский опыт.

- Security Copilot: Предлагает специализированные знания для обеспечения безопасности организации.

- Microsoft Copilot Studio: No/low code решение без кода с тысячами готовых плагинов, упрощающее создание новых приложений Copilot.

- GitHub Copilot: Теперь более мощный, с такими возможностями, как объяснение кода в Visual Studio Code и быстрое исправление ошибок.

- Синергия данных и ИИ: Признавая важность данных, Microsoft подчеркнула успех ChatGPT, работающего на базе Azure Cosmos DB, и представила Microsoft Fabric для расширенной аналитики данных.

- Инновационные функции: Векторный поиск в Azure AI Search и полный доступ к лучшим моделям OpenAI.

- Партнерство с NVidia: Продвижение NeMO для расширения возможностей ИИ.

- Chat Studio: Интуитивно понятная платформа для создания и настройки решений для чатов с легкой интеграцией поиска Azure AI и озер данных.

- PromptFlow: Визуальный интерфейс для создания цепочек промптов, Python и RAG, развертываемый как Azure endpoint.

- Azure Content Safety: Внедрение фильтров контента и настраиваемых параметров допустимости для более безопасного контента.

Выводы
Акцент Microsoft на простоте использования, безопасности и надежной аналитике данных указывает на значительный сдвиг в сторону ИИ-ориентированных решений, упрощающих сложные задачи и стимулирующих инновации среди разработчиков.

🔥4👍2

2.17K views20:08

2025/07/11 22:55:01
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.tgoop.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>