tgoop.com/LegalMindAI/20
Last Update:
Новый Claude 3.7 Sonnet. Результаты теста.
Как всегда в анонсе - эта модель лучшая из лучших, самый умный и мощный ИИ в мире и т.д.
3.7 Sonnet уже появилась в интерфейсе Claude (в платной версии точно).
Стало безумно интересно и я ее протестировал, используя мой бенчмарк (30 критериев, связанных с различиями между обыском, обследованием и осмотром места происшествия в уголовном процессе).
Модель не допустила ни одной критической ошибки и дала очень уверенные и точные ответы.
В моих глазах Claude в лице 3.7 Sonnet вновь вернул себе лидерство, утраченное примерно на пару дней из-за выхода Grok 3 😂
Но самое удивительное, что моему исследованию способностей ИИ едва исполнилось две недели, а некоторые изложенные в нем показатели уже сильно устарели.