tgoop.com/sysblok/1040
Last Update:
Большие изменения в OpenAI, долгожданное обновление голосового режима GPT, новые LLama
Рассказываем, что произошло за последнее время в мире ИИ.
Исход людей из OpenAI продолжается
25 сентября Мира Мурати, техническая директриса OpenAI, сообщила о своём увольнении. Этот пост Мира занимала шесть с половиной лет, а уход объяснила стремлением разобраться в собственных желаниях и целях.
1 октября один из сооснователей OpenAI Дёрк Кингма рассказал, что присоединился к Anthropic, главному конкуренту OpenAI. Ранее мы также писали об уходе ключевых сотрудников из компании. Таким образом, из четырёх главных лиц компании в штате остался только генеральный директор — Сэм Альтман.
Новый голосовой режим GPT и другие обновления от OpenAI
На недавней презентации для разработчиков компания объявила о запуске обновления голосового режима, благодаря которому GPT может проявлять эмоции, смеяться и петь во время беседы. Релиз обновления состоялся ещё в мае, однако из-за сложностей с правами на голос Скарлетт Йоханссон и мер безопасности обновление стало доступно только сейчас в США и Великобритании. Пользователи из Европейского союза не смогут протестировать нововведения из-за законов, регулирующих ИИ.
Также на презентации OpenAI рассказала о нескольких новых сервисах: Realtime API, который позволит генерировать аудиоответы GPT на текстовые/голосовые вопросы пользователей в реальном времени; возможность дообучать GPT на изображениях (раньше можно было только на текстах), а также дообучать их модели, используя другие (например, обучать маленькую GPT на ответах большой версии).
Новые LLama
Компания Meta* пополнила семейство моделей LLama. Теперь пользователям доступны две компактные LLM: с 1 и 3 млрд параметров. Обе модели были обучены для работы с текстами на разных языках и по качеству несущественно уступают большим версиям LLama. Благодаря своим компактным размерам модели можно использовать на мобильных устройствах.
Помимо этого были представлены две LLM, способные работать не только с текстами, но и с изображениями, в размерах 11 и 90 млрд параметров. По показателям в основных тестах модели сопоставимы с конкурентами.
Все модели доступны для скачивания и коммерческого использования, однако официально модели недоступны на территории Европейского союза.
Google обновила свои LLM
Компания Google обновила свою флагманскую LLM Gemini Pro и компактную модель Gemini Flash. Обе языковые модели теперь могут работать с более длинными текстами: Gemini Pro поддерживает 2 миллиона входных токенов против миллиона у предыдущей версии (токен — единица измерения текста), а Gemini Flash — 32 тысячи против восьми тысяч предшественника. Обновлённые модели существенно лучше в понимании текстов и изображений, а Flash стала ещё быстрее.
*Компания Meta признана экстремистской, а её деятельность запрещена на территории РФ