Telegram Web
Сегодня день рождения Kandinsky (самая популярная его версия вышла 4 апреля 2023 года, и с этого началась настоящая история линейки Kandinsky)🎉🎉🎉

И в этот день мы выпустили обновление модели Kandinsky 3.1, в котором:
📍добавили существенное увеличение скорости генерации за счёт дистилляции модели
📍затащили обратно режимы смешивания и вариации изображений вкупе с ControlNet
📍добавили возможность повышения разрешения генераций до 4K

Подробнее можно почитать на Хабре, ну а для всех мы покажем обновление на всех платформах чуть позже. Пишите вопросы в комментариях, буду рад ответить😉

С Днём Рождения, Kandinsky! С праздником всю нашу команду и всех почитателей творчества Generative AI🥂

🍰Ссылка на Хабр

@complete_ai
❤‍🔥54🎉249👏8🔥5🏆4👍2👎2
Forwarded from Институт AIRI
This media is not supported in your browser
VIEW IN TELEGRAM
Отметили 3 года Института!

Сегодня все сердца поста — команде AIRI ❤️
❤‍🔥48👍166👏5😁2
Forwarded from HighLoad++
Всем привет! Сегодня знакомим вас с первыми спикерами секции «Нейронные сети, искусственный интеллект»

1) Андрей Кузнецов (AIRI) «Как научить фундаментальные модели читать, видеть, слышать и анализировать всё одновременно»

Моделью, которая умеет общаться текстом, сейчас уже никого не удивишь. Андрей расскажет, из чего собрать модель, которая в дополнение к этому умеет смотреть картинки и слушать речь. Очередной шаг на пути к General AI!

2) Алексей Воропаев (SberAutoTech) «Архитектура беспилотного транспорта нового поколения»

Доклад позволит узнать, как NeRF нейросети позволяют организовать End2End обучение и тестирование современного беспилотного транспорта.

3) Евгений Кокуйкин (Raft) «Новые атаки на LLM и методы защиты для прикладных приложений»

Чем больше LLM проникает в нашу жизнь, тем острее встают вопросы безопасности. Вариативность атак меняется не просто быстро, а очень быстро. Из доклада вы получите полное представление о текущем состоянии атак на LLM и научитесь идентифицировать потенциальные уязвимости в своих приложениях.

Присоединяйтесь к нам 24 и 25 июня на Saint HighLoad++ 2024 🙌

Ознакомиться со всеми принятыми докладами и купить билет можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👏18🔥7👍3👎21
⚡️Сегодня выпустили обновление нашей мультимодальной модели OmniFusion 1.1

Модель умеет понимать изображения, описывать сцены и отвечать на вопросы по картинкам. В основе open-source модели лежит языковая модель Mistral-7B.

В остальном было проделано большое число экспериментов,в числе которых:
- сравнили различные визуальные энкодеры
- научились смешивать несколько энкодеров для усиления визуального контекста
- проверили влияние механики нарезки картинки на фрагменты с последующим их энкодингом

В итоге побили 7B аналогичные решения на ряде бенчмарков, побили также 13B модели на некоторых бенчах. Исследования продолжаются, чтобы выбить однозначную SoTA на всех задачах и приблизиться к GPT4-Vision.

Сегодня выпустили technical report на arXiv, который попал в Daily Papers на Hugging Face и уже занимает там сейчас первое место🏆

📍Project page
📍Статья на Хабре
📍GitHub

Буду крайне признателен, если поддержите лайками, звёздами и upvote по ссылкам выше - всей команде будет супер приятно🙏

@complete_ai
🔥55👍18🏆9❤‍🔥71
🚀Мы с Kandinsky поздравляем всех с Днём Космонавтики!

Достигайте самых амбициозных высот!
За арты спасибо @kutsgelya

@complete_ai
❤‍🔥22👍9🔥73👏2🏆2😁1🎉1
Комментарии излишни 🤗
😁49👍12🔥5👏2
Сегодня выступаю и модерирую секцию про мультимодальный и генеративный ИИ на конференции по анализу данных и технологиям DataFusion (начало в 15.50 мск). Поговорим про современное состояние исследований в этих областях и интересные решения и технологии, которые нас ждут в недалёком будущем.

Мероприятие проходит оффлайн в Кластере Ломоносов на Раменском бульваре д.1, а также будет онлайн трансляция ( зарегистрироваться можно тут ).
26🔥13👍9👏1
Forwarded from эйай ньюз
🔥LLaMa 3 - дождались: Новая SOTA в open-source!

Сегодня день больших релизов от Meta, в которых и я и моя команда принимала прямое участие.

Зарелизили в опенсорс LLaMa-3 8B и 70B:
🔳LLaMa-3 8B – лучшая в своем классе модель, и сопоставима с LLaMa-2 70B, хоть и в 10 раз меньше.
🔳LLaMa-3 70B – тоже самая мощная в режиме 70 млрд параметров, достигает 82 на MMLU бенчмарке (показывает уровень общих знаний в разных областях). Для сравнения, недавняя Mixtral 8x22B с 141B параметров достигает только MMLU 77.8. Ну, и ждем результатов на арене.

C новыми моделями можно початиться на meta.ai

Блог
Подробности
Скачать веса модели

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥24👍11
⚡️Вот и тех репорт по языковой модели Phi-3 пожаловал

На известном MMLU 7B версия уверенно обходит и Llama 3, и Gemma, и Mistral. Ждём доученной версии, разрывающей GPT-4😉

https://arxiv.org/abs/2404.14219
🔥14👍64
Дизайнеры vs AI. The winner is

В этом году наш институт AIRI решил поддержать IV Конкурс-биеннале предметного дизайна «Придумано и сделано в России» впервые появилась номинация «AI‑технологии».

В рамках конкурса я буду выступать в роли куратора номинации «AI-технологии в дизайне», а мой коллега Денис @dendimitrov - членом экспертного жюри.

Эксперты оценят как дизайнеры «общаются»с генеративными моделями и насколько точно им удается воплотить задуманное. Это интересный опыт как для дизайнеров, креаторов, так и для экспертов, ведь надо быть непредвзятым между человеком и ИИ😉

Знаю, что среди моих подписчиков много промпт-инженеров, дизайнеров и представителей других творческих профессий - этот ивент для вас🖼️

🍿 Все подробности на официальном сайте конкурса. Подать заявку можно до 12 августа 2024 года. Участвуйте и побеждайте!
🔥23👍8
Не прошло и дня, как MS выложили веса Phi-3 Mini.
Дали доступ к инструктивным версиям с контекстом 4k и 128k токенов, а также onnx и gguf адаптации модели

Мы забрали пощупать модель в возникающий уже зоопарк реализаций OmniFusion — расскажу по итогу, что получится
👍22🔥1051
Forwarded from Институт AIRI
Запускаем Большой Семинар AIRI — пространство для знакомства исследователей из разных областей и всех, кто интересуется наукой 💡

21 мая в 17:30 российский химик, академик РАН, заведующий лабораторией Института органической химии им. Н. Д. Зелинского РАН Валентин Анаников выступит с докладом «Искусственный интеллект в химии».

Модератор Большого Семинара AIRI — доктор физико-математических наук, профессор РАН, CEO Института AIRI, профессор Сколтеха Иван Оселедец.

Приглашаем вас разделить с нами запуск проекта, послушать лекцию и поучаствовать в дискуссии.

📌Регистрируйтесь по ссылке и делитесь постом с друзьями и коллегами!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍83
А пока все судорожно восхищаются апдейтами GPT-4o (кстати o - это Omni, значит наша модель OmniFusion в тренде:)), сегодня TII выпустили новую версию мультимодальной модели Falcon 2 (новость)

- Falcon 2 open source, мультиязычная мультимодальная LLM
- Falcon 2 11B превосходит Llama 3 8B и выбивает по качеству значения на уровне с моделью Google Gemma 7B
- В настоящее время авторы исследуют возможность еще большего улучшения качества с помощью Mixture of Experts

@complete_ai
🔥16👍53
А если про GPT-4o, то мой feedback такой:
- синтез речи впечатляет
- трансляция эмоций, стиля в голосе - эмпатия не за горами
- вопросы в пользователю и четкое следование инструкциям - поможет с уточнением задачи в случае неуверенности в ответах, снизятся галлюцинации
- генерация и компиляция кода очень быстрая 👍
- в части понимания картинок и видео примеры были достаточно примитивные, полноценное видео для их решения не требовалось

Ну и конечно, наконец Open AI может словом «Open» в названии пользоваться полноценно - GPT-4o теперь будет доступна всем бесплатно

Кто захочет послушать презентацию апдейтов, ссылку оставляю:
https://www.youtube.com/live/DQacCB9tDaw
26🔥15👍6
Крайне интересный лик обнаружил подписчик канала)
Удивительно, как такие вещи во время всеобщего помешательства на AI Alignment

https://www.tgoop.com/agilabs
5❤‍🔥3
2025/07/14 04:21:17
Back to Top
HTML Embed Code: