tgoop.com/black_triangle_tg/6051
Last Update:
DeepSeek-V3: Китайская языковая модель обошла Claude 3.5 Sonnet в программировании.🤖
Компания DeepSeek, с поддержкой китайского хедж-фонда High-Flyer, анонсировала свою новую языковую модель DeepSeek-V3, обладающую впечатляющими 685 миллиардами параметров.
Эта модель заметно повысила качество контекстного понимания и генерации ответов, продемонстрировав 48.4% успешных решений на тесте Aider Polyglot и заняв второе место.🔥
Модель уступила только o1-2024-12-17 (61.7%), но превзошла такие известные модели как Claude-3-5-sonnet-20241022 (45.3%) и Gemini-exp-1206 (38.2%).
Тест включает 225 сложнейших задач с платформы Exercism по программированию на C++, Go, Java, JavaScript, Python и Rust.
Особенно выделяется её способность к форматированию кода — 98.7% правильных решений, а также мультимодальные возможности, позволяющие работать с диаграммами и изображениями.📊
Модель можно попробовать на сайте chat.deepseek.com
================