Media is too big
VIEW IN TELEGRAM
Брюссель выпустил практическое руководство, которое должно помочь компаниям подготовиться к вступлению в силу Закона об ИИ. Документ детализирует требования к моделям общего назначения по трем ключевым направлениям: прозрачность, авторское право и безопасность.
Разработчикам предстоит документировать источники данных для обучения, предоставлять интерфейсы для аудита и внедрять фильтры для защищенного контента. Требования по безопасности включают обязательное проведение red-teaming и оценку рисков.
Нормы станут обязательными со 2 августа 2025 года, и их публикация сигнализирует об отказе регулятора откладывать сроки, несмотря на просьбы бизнеса. Штрафы за несоблюдение могут достигать 35 миллионов евро или 7% от оборота.
digital-strategy.ec.europa.eu
GitHub изменил модели тарификации для Copilot coding agent, делая ее более предсказуемой. Теперь каждая сессия работы с агентом, будь то создание нового pull-request или изменение существующего, будет стоить ровно один «премиум-запрос».
Это изменение устраняет неопределенность в расходах. Независимо от сложности задачи и количества затронутых файлов, стоимость сессии остается фиксированной. По заявлению GitHub, такой подход позволит пользователям делегировать агенту до 20 раз больше задач в рамках своей месячной подписки.
Стоит отметить, что хотя использование премиум-запросов стало предсказуемым, расход минут GitHub Actions все еще зависит от времени, которое требуется агенту на выполнение работы. Функция доступна в публичной бета-версии для всех платных планов GitHub Copilot.
github.blog
Стартап Butterfly Effect, разработчик популярного ИИ-агента Manus, ликвидировал всю свою команду в Китае. Это часть стратегии по минимизации геополитических рисков, поскольку основной целевой рынок компании - США. Ранее стартап уже перенес штаб-квартиру из Китая в Сингапур, куда переехали и его основатели.
Компания, получившая поддержку от фонда Benchmark, теперь активно нанимает сотрудников в новых офисах в Калифорнии и Токио. Решение полностью свернуть операции в КНР отражает растущую тенденцию среди технологических стартапов с глобальными амбициями. Они вынуждены дистанцироваться от Китая, чтобы избежать политического давления и обеспечить себе доступ на западные рынки.
theinformation.com
Стартап Reka, основанный выходцами из DeepMind и FAIR, представил новую открытую модель Reka Flash 3.1. Эта модель с 21 миллиардом параметров показывает высокую производительность в задачах, связанных с программированием, и позиционируется как сильная основа для создания ИИ-агентов. Она уже доступна на Hugging Face, через API и в Playground.
Одновременно компания выпустила библиотеку Reka Quant. Она позволяет сжимать модель до 3.5 бит практически без потери производительности - падение метрик составляет всего 1.6% по сравнению с 6.8% у стандартных методов.
reka.ai
Amazon Web Services на следующей неделе представит собственный маркетплейс для ИИ-агентов. Платформа, запуск которой ожидается на саммите AWS в Нью-Йорке, позволит стартапам напрямую предлагать свои разработки огромной базе корпоративных клиентов облачного гиганта. Anthropic станет одним из ключевых партнеров на старте, что даст ему серьезное преимущество в конкуренции с OpenAI.
Модель работы будет напоминать магазины приложений: AWS будет взимать комиссию, а разработчики смогут продавать своих агентов по подписке. Запуском собственной площадки Amazon следует тренду, заданному конкурентами. Аналогичные маркетплейсы уже есть у Google Cloud, Microsoft, Salesforce и ServiceNow.
techcrunch.com
Google заплатил $2.4 млрд, на $600 млн меньше, чем OpenAI.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤54👍40🔥16🗿7🤣5🥰1
Как получить первый коммерческий опыт до выхода на первую работу, положить в портфолио классный пет-проект и впечатлить работодателя умением не просто действовать по шаблону, а сходу решать задачи бизнеса?
Для этого мало просто разобраться в Python и SQL, нужно набивать руку на реальных кейсах и тренировать насмотренность — смотреть на то как решают эти задачи опытные аналитики.
Решить такой кейс и добавить его к себе в портфолио можно будет на вебинаре с Андроном Алексаняном, аналитиком с 8 летним опытом и по совместительству CEO Simulative.
В прямом эфире он решит реальный кейс компании: проанализирует продажи на Wildberries с помощью Python.
Что будем на вебинаре:
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣32❤18👍12😁3💅2
Это модель, которая не просто доказывает теоремы, а учится на своих ошибках.
Kimina-Prover-72B создана на базе Qwen2.5-72B, которая бьет рекорды в формальной математике на Lean 4 и ее облегченные версии 8 и 1,7 миллиарда параметров.
Numina - это некоммерческая научная коллаборация, ориентированная на развитие ИИ в области математики. Ее миссия: создание и публикация обширных баз данных математических задач, разработку open-source ИИ-решателя для их обработки и инструментов для поддержки совместной работы людей и ИИ в фундаментальных науках.
На популярном бенчмарке miniF2F Kimina-Prover-72B достигла внушительной точности в 92.2%, оставив позади Deepseek-Prover-V2 671B.
Вместо того чтобы пытаться решить сложную задачу в лоб, система научилась декомпозировать ее. Она самостоятельно генерирует, комбинирует и применяет промежуточные утверждения, или леммы, выстраивая из них длинные логические цепочки. По сути, это рекурсивный поиск: для доказательства основной теоремы модель может сначала доказать несколько вспомогательных лемм.
Система отслеживает «рейтинг полезности» каждой леммы и отбраковывает те, что ведут в тупик. Вторым эшелоном идет механизм проверки на вменяемость. Прежде чем использовать новую лемму, модель пытается доказать ее отрицание. Если это удается, значит, лемма противоречива и ее сразу выбрасывают. Такая комбинация гарантирует логическую строгость и надежность всего доказательства.
В отличие от других систем, которые в случае неудачи просто начинают заново, Kimina-Prover умеет читать сообщения об ошибках от компилятора Lean и предлагать исправления.
Для этого ее специально дообучали на датасете из комбинаций «неверное доказательство – фидбэк – верное доказательство». Чтобы обучение шло стабильно, использовали стратегию Batched Failure Replay: все неудачные попытки с одной итерации собираются и используются как обучающий батч для следующей. И это оказалось куда эффективнее, чем бездумный перебор вариантов при том же бюджете вычислений.
@ai_machinelearning_big_data
#AI #ML #LLM #TTRL #Reasoning #KiminaProver
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤56🔥37👍25👏3😁2