tgoop.com/devby/12484
Last Update:
🤼♀️ Китайский ИИ-стартап наделал шуму в Долине, обогнал ChatGPT в App Store, потянул вниз Nasdaq
Небольшой китайский ИИ-стартап DeepSeek разрабатывает большие языковые модели в условиях ограниченного бюджета и технических ресурсов. На прошлой неделе он выпустил модель R1, которая напугала представителей Кремниевой долины.
🔵 R1 — «рассуждающая» модель с открытым исходным кодом на 671 млрд параметров. На некоторых ИИ-бенчмарках она не уступает o1 от OpenAI. Будучи китайской моделью, R1 зацензурирована и не отвечает на некоторые запросы. Для обучения модели стартапу потребовалось всего 2048 графических процессоров H800 от Nvidia и $5,6 млн, что в разы меньше затрат OpenAI и Google.
🔵 DeepSeek основал китайский миллиардер и управляющий хедж-фонда High-Flyer Лян Вэньфэн, уже ставший предметом гордости в своей стране. В 2021 году он начал тысячами скупать графические процессоры Nvidia для стороннего проекта по обучению моделей. В 2023-м он запустил DeepSeek, заявив, что хочет разработать ИИ, не уступающий человеку, и собрал мощную команду.
🔵 Инвесторы сравнивают DeepSeek с ранним DeepMind, когда тот занимался лишь исследованиями и разработками. Зарплаты сотрудникам DeepSeek Лян выплачивает из доходов своего хедж-фонда. Причём это зарплаты уровня ByteDance — самые высокие среди ИИ-специалистов в Китае. У DeepSeek есть офисы в Ханчжоу и Пекине. Сотрудники, которых набирает Лян, получали образование на родине, а не в США, а в ядре команды, по его словам, «нет людей, которые вернулись из-за рубежа».
🔵 Приложение DeepSeek за выходные вышло в лидеры в бесплатном топе в американском сегменте App Store, обогнав ChatGPT. Фьючерсы на технологический индекс Nasdaq 100 в Азии сегодня снизились почти на 2%, а котировки Nvidia на премаркете упали на 10%.
Подробнее
Эта ссылка откроется в Беларуси
Чытаць па-беларуску
BY dev.by: главные ИТ-новости Беларуси
Share with your friend now:
tgoop.com/devby/12484