Юристы & Нейросети

Про новую модель Gemini 2.5 Pro и рост качества ответов

Конец марта принес много обновлений в мире ИИ:

🔷Обновился Deepseek (тестировал, не впечатлил)
🔷В Telegram появился бот от Grok (тестировал не впечатлил)
🔷Обновился ChatGPT 4o - стал заметно лучше, отлично генерирует изображения.

Но самое интересное для меня - выход Gemini 2.5 Pro.

В сети много восторженных отзывов о способностях данной модели в вайб-кодинге, логических рассуждениях и мультимодальном понимании.

Решил проверить эту модель на моем бенчмарке - 30 критериев по теме различий между обыском, обследованием и осмотром места происшествия в уголовном процессе.

Ранее, в феврале этого года, Gemini 2.0 Flash в ходе исследования дала лишь 66,7% правильных ответов.

Тестируем Gemini 2.5 Pro

Сейчас протестировал Gemini 2.5 Pro в четырех сценариях: через пользовательский интерфейс и интерфейс разработчика, с загрузкой НПА и без загрузки.

Максимальный результат - 98,3% правильных ответов, когда модель работала через интерфейс разработчика и с подгруженной базой НПА.

Прогресс - с 66,7% до 98,3% за два месяца!

Мои выводы и впечатления

🔷Динамика впечатляет: +31,6% качества ответов за два месяца. Наглядно показывает скорость развития ИИ.
🔷Без загрузки базы с НПА модель все еще местами галлюционирует при обсуждении нюансов уголовного процесса. Поэтому здесь надо либо загружать свою базу НПА, либо использовать функцию Deep Research.

Про лимиты и что с этим делать

Gemini 2.5 Pro доступна бесплатно для всех пользователей, но с существенными ограничениями. Полноценно работать в бесплатной версии очень сложно. После нескольких диалогов лимиты заканчиваются.

Однако есть неочевидный способ бесплатно использовать Gemini 2.5 Pro и практически без ограничений. И эта история не про использование ботов в Telegram.

🎙️ Рассказать?

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥53👍38🙏12❤9👏4

4.03K views12:23