Notice: file_put_contents(): Write of 762 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50

Warning: file_put_contents(): Only 12288 of 13050 bytes written, possibly out of free disk space in /var/www/tgoop/post.php on line 50
Алексей Хохлов@khokhlovAR P.901
KHOKHLOVAR Telegram 901
В последние дни я много слышал о китайском чудо-инструменте искусственного интеллекта DeepSeek, который не только работает лучше многих имеющихся инструментов, основанных на больших языковых моделях (в том числе, лучше ChatGPT, даже в последней версии), но и относится к категории Open Source, кроме того он бесплатно-свободно и без всяких ухищрений доступен российским пользователям. А вчера вышла хвалебная статья в Science об этом инструменте:

https://www.science.org/content/article/chinese-firm-s-faster-cheaper-ai-language-model-makes-splash

В частности, в ней утверждается, что подход DeepSeek «включает улучшение так называемой архитектуры Mixture of Experts. Она снижает вычислительную мощность, необходимую для обучения модели, и выдает более эффективные ответы на запросы. Только подмножество экспертных сетей в модели обучается для выполнения задачи. Затем сеть отправляет адресные запросы только тем экспертным сетям, которые наиболее подходят для ответа.»

В результате на обучение DeepSeek было потрачено всего $5.6 млн., тогда как обучение ChatGPT-4o стоило $78 млн. Операционные затраты при работе DeepSeek также намного меньше, чем для других моделей. Стоит также обратить внимание на слова генерального директора DeepSeek Лян Вэньфэна о том, что «исследования и технологические инновации, а не бизнес-возможности, являются приоритетом компании. Ее конечная цель — достичь такого уровня искусственного интеллекта, который бы соответствовал когнитивным способностям человека. Эта высокая цель помогла фирме привлечь амбициозных исследователей.»

После таких рекомендаций от Science я решил проверить, как все это работает. Зашел на

https://www.deepseek.com/

непосредственно через google-account и приступил к общению в чате на тему предыдущего поста (опубликованного сегодня утром) о глобальном потеплении. Результат можно посмотреть здесь:

https://disk.yandex.ru/i/-7IxJEx0SsmpKw

Видно, что ответы на мои короткие вопросы полные и исчерпывающие, хотя они не выходят за рамки mainstream reasoning (но странно было бы ожидать оригинальности от большой языковой модели). Потом я начал использовать поисковую функцию «Search», просил дать ссылки на обзорные статьи по тому или иному научному вопросу – все работает, причем ответ выдается не в виде совокупности ссылок, а в виде связного текста, куда ссылки вкраплены, как во введении к реальной научной статье. Причем все ссылки реальные, не вымышленные, как часто бывает в текстах, написанных ChatGPT.

Потом я перешел на общение на русском языке – все точно так же отлично работает, включая не только научные вопросы, но и, например, написание стихов на какую-нибудь тему в стиле того или иного поэта прошлого (опять-таки, если обращать внимание на стиль, а не оригинальность мысли). В общем, советовал бы попробовать этот инструмент, к которому у российских пользователей есть безбарьерный и бесплатный доступ (кстати, его можно установить и на мобильных устройствах, скачав соответствующее приложение из AppStore или GooglePlay).



tgoop.com/khokhlovAR/901
Create:
Last Update:

В последние дни я много слышал о китайском чудо-инструменте искусственного интеллекта DeepSeek, который не только работает лучше многих имеющихся инструментов, основанных на больших языковых моделях (в том числе, лучше ChatGPT, даже в последней версии), но и относится к категории Open Source, кроме того он бесплатно-свободно и без всяких ухищрений доступен российским пользователям. А вчера вышла хвалебная статья в Science об этом инструменте:

https://www.science.org/content/article/chinese-firm-s-faster-cheaper-ai-language-model-makes-splash

В частности, в ней утверждается, что подход DeepSeek «включает улучшение так называемой архитектуры Mixture of Experts. Она снижает вычислительную мощность, необходимую для обучения модели, и выдает более эффективные ответы на запросы. Только подмножество экспертных сетей в модели обучается для выполнения задачи. Затем сеть отправляет адресные запросы только тем экспертным сетям, которые наиболее подходят для ответа.»

В результате на обучение DeepSeek было потрачено всего $5.6 млн., тогда как обучение ChatGPT-4o стоило $78 млн. Операционные затраты при работе DeepSeek также намного меньше, чем для других моделей. Стоит также обратить внимание на слова генерального директора DeepSeek Лян Вэньфэна о том, что «исследования и технологические инновации, а не бизнес-возможности, являются приоритетом компании. Ее конечная цель — достичь такого уровня искусственного интеллекта, который бы соответствовал когнитивным способностям человека. Эта высокая цель помогла фирме привлечь амбициозных исследователей.»

После таких рекомендаций от Science я решил проверить, как все это работает. Зашел на

https://www.deepseek.com/

непосредственно через google-account и приступил к общению в чате на тему предыдущего поста (опубликованного сегодня утром) о глобальном потеплении. Результат можно посмотреть здесь:

https://disk.yandex.ru/i/-7IxJEx0SsmpKw

Видно, что ответы на мои короткие вопросы полные и исчерпывающие, хотя они не выходят за рамки mainstream reasoning (но странно было бы ожидать оригинальности от большой языковой модели). Потом я начал использовать поисковую функцию «Search», просил дать ссылки на обзорные статьи по тому или иному научному вопросу – все работает, причем ответ выдается не в виде совокупности ссылок, а в виде связного текста, куда ссылки вкраплены, как во введении к реальной научной статье. Причем все ссылки реальные, не вымышленные, как часто бывает в текстах, написанных ChatGPT.

Потом я перешел на общение на русском языке – все точно так же отлично работает, включая не только научные вопросы, но и, например, написание стихов на какую-нибудь тему в стиле того или иного поэта прошлого (опять-таки, если обращать внимание на стиль, а не оригинальность мысли). В общем, советовал бы попробовать этот инструмент, к которому у российских пользователей есть безбарьерный и бесплатный доступ (кстати, его можно установить и на мобильных устройствах, скачав соответствующее приложение из AppStore или GooglePlay).

BY Алексей Хохлов




Share with your friend now:
tgoop.com/khokhlovAR/901

View MORE
Open in Telegram


Telegram News

Date: |

Telegram Android app: Open the chats list, click the menu icon and select “New Channel.” Channel login must contain 5-32 characters Commenting about the court's concerns about the spread of false information related to the elections, Minister Fachin noted Brazil is "facing circumstances that could put Brazil's democracy at risk." During the meeting, the information technology secretary at the TSE, Julio Valente, put forward a list of requests the court believes will disinformation. How to create a business channel on Telegram? (Tutorial) It’s easy to create a Telegram channel via desktop app or mobile app (for Android and iOS):
from us


Telegram Алексей Хохлов
FROM American