HIAIMEDIA Telegram 1520
💬 Успех DeepSeek: как китайская open source модель бросает вызов ChatGPT

Китайская компания DeepSeek представила новую языковую модель с открытым исходным кодом — DeepSeek V3. В отличие от многих конкурентов, она доступна для свободного использования, в том числе в коммерческих проектах.

🖥 Умелый программист

DeepSeek V3 показала себя лучше других LLM почти во всех основных бенчмарках (см. таблицу ⤴️). Особенно хорошо DeepSeek V3 справляется с программированием. В тесте Aider Polyglot, проверяющем навык ИИ писать код, который можно встроить в существующие программы, DeepSeek V3 уступает только последней версии OpenAI o1.

💰 Быстро, дешево, качественно

За этими достижениями стоит серьезная подготовка. DeepSeek V3 обучена на объеме данных в 14,8 трлн токенов. Это соответствует примерно 11,1 трлн слов — как если бы ИИ прочитал все написанные человечеством книги несколько раз подряд.

Также DeepSeek V3 крупнейшая на сегодняшний день open source модель по числу параметров — 671 млрд. Прошлый лидер, Llama 3.1, имеет всего 405 млрд. Такой объем параметров позволяет нейросети лучше понимать контекст и решать более сложные задачи, но у этого есть своя цена. Чтобы работать с приемлемой скоростью, модели требуется очень мощное «железо».

С другой стороны, DeepSeek совершили прорыв в эффективности: с помощью специализированных GPU Nvidia H800 они обучили свою модель всего за два месяца. При этом разработка DeepSeek V3 обошлась компании всего в $5,5 млн. Для сравнения: на создание GPT-4 OpenAI потребовалось около $78 млн.

👁 Идеологически подкована

Как китайская компания DeepSeek подчиняется правилам интернет-регулятора КНР. Прежде всего, компания должна гарантировать, что ответы ее моделей соответствуют ценностям правящей партии. Поэтому DeepSeek V3 очень обтекаемо отвечает на острые запросы о политическом режиме в Китае на «родном» языке. На русском и английском чат-бот гораздо охотнее рассказывает о непростых вещах, но иногда все-таки предпочитает промолчать.

➡️ Пообщаться с DeepSeek V3 бесплатно можно здесь

Еще по теме:

🛑 Главные тренды 2024 года в ИИ: чего нам ждать дальше?

🛑 Чем отличается открытый и закрытый исходный код

👋 Подпишитесь на Hi, AI!

#новости #DeepSeek
Please open Telegram to view this post
VIEW IN TELEGRAM



tgoop.com/hiaimedia/1520
Create:
Last Update:

💬 Успех DeepSeek: как китайская open source модель бросает вызов ChatGPT

Китайская компания DeepSeek представила новую языковую модель с открытым исходным кодом — DeepSeek V3. В отличие от многих конкурентов, она доступна для свободного использования, в том числе в коммерческих проектах.

🖥 Умелый программист

DeepSeek V3 показала себя лучше других LLM почти во всех основных бенчмарках (см. таблицу ⤴️). Особенно хорошо DeepSeek V3 справляется с программированием. В тесте Aider Polyglot, проверяющем навык ИИ писать код, который можно встроить в существующие программы, DeepSeek V3 уступает только последней версии OpenAI o1.

💰 Быстро, дешево, качественно

За этими достижениями стоит серьезная подготовка. DeepSeek V3 обучена на объеме данных в 14,8 трлн токенов. Это соответствует примерно 11,1 трлн слов — как если бы ИИ прочитал все написанные человечеством книги несколько раз подряд.

Также DeepSeek V3 крупнейшая на сегодняшний день open source модель по числу параметров — 671 млрд. Прошлый лидер, Llama 3.1, имеет всего 405 млрд. Такой объем параметров позволяет нейросети лучше понимать контекст и решать более сложные задачи, но у этого есть своя цена. Чтобы работать с приемлемой скоростью, модели требуется очень мощное «железо».

С другой стороны, DeepSeek совершили прорыв в эффективности: с помощью специализированных GPU Nvidia H800 они обучили свою модель всего за два месяца. При этом разработка DeepSeek V3 обошлась компании всего в $5,5 млн. Для сравнения: на создание GPT-4 OpenAI потребовалось около $78 млн.

👁 Идеологически подкована

Как китайская компания DeepSeek подчиняется правилам интернет-регулятора КНР. Прежде всего, компания должна гарантировать, что ответы ее моделей соответствуют ценностям правящей партии. Поэтому DeepSeek V3 очень обтекаемо отвечает на острые запросы о политическом режиме в Китае на «родном» языке. На русском и английском чат-бот гораздо охотнее рассказывает о непростых вещах, но иногда все-таки предпочитает промолчать.

➡️ Пообщаться с DeepSeek V3 бесплатно можно здесь

Еще по теме:

🛑 Главные тренды 2024 года в ИИ: чего нам ждать дальше?

🛑 Чем отличается открытый и закрытый исходный код

👋 Подпишитесь на Hi, AI!

#новости #DeepSeek

BY Hi, AI | Новости технологий




Share with your friend now:
tgoop.com/hiaimedia/1520

View MORE
Open in Telegram


Telegram News

Date: |

Other crimes that the SUCK Channel incited under Ng’s watch included using corrosive chemicals to make explosives and causing grievous bodily harm with intent. The court also found Ng responsible for calling on people to assist protesters who clashed violently with police at several universities in November 2019. The administrator of a telegram group, "Suck Channel," was sentenced to six years and six months in prison for seven counts of incitement yesterday. Your posting frequency depends on the topic of your channel. If you have a news channel, it’s OK to publish new content every day (or even every hour). For other industries, stick with 2-3 large posts a week. Done! Now you’re the proud owner of a Telegram channel. The next step is to set up and customize your channel. The public channel had more than 109,000 subscribers, Judge Hui said. Ng had the power to remove or amend the messages in the channel, but he “allowed them to exist.”
from us


Telegram Hi, AI | Новости технологий
FROM American