Telegram Web
OpenAI против китайского ИИ, новая open-source модель от Google и Mistral Small

Рассказываем, что произошло в мире ИИ за последнее время.

OpenAI против китайского ИИ

В рамках инициативы администрации Трампа AI Action Plan компания OpenAI предложила изменить правила экспорта вычислительных чипов американского производства. AI Action Plan — это инициатива, в которой могут участвовать компании, научные организации и политики, предлагая свои идеи по стратегическому развитию ИИ в США. По итогам обсуждений будет сформирована государственная политика, направленная на «укрепление позиций Америки» в глобальной конкуренции в сфере ИИ.

Вместо полного запрета экспорта чипов в некоторые страны предлагается разрешить поставки при условии, что дата-центры не будут использоваться для работы китайских моделей ИИ. Такое ограничение обусловлено опасениями OpenAI, что китайские разработки вынуждены подчиняться требованиям правительства КНР, что может привести к утечке пользовательских данных при использовании китайских моделей.

Сейчас Китай — главный конкурент США в ИИ-гонке. Китайские компании и лаборатории вносят существенный вклад в развитие ИИ за счет публикации передовых моделей и подробной технической документации в открытый доступ. Многие корпорации используют китайские модели как основу: в частности, последние языковые модели Яндекса и Т-Банка являются дообученными версиями Qwen2.5, разработанной Alibaba Group.

Gemma 3 — обновленная open-source LLM от Google

Компания Google обновила свою open-source языковую модель Gemma.

Третья версия модели доступна в четырех размерах: 1, 4, 12, 27 млрд параметров. Все модели, кроме самой маленькой, поддерживают обработку текста и изображений, версия с 1 млрд параметров умеет работать только с текстом.

По оценкам пользователей LMArena, где каждый желающий может сравнить ответы разных LLM, Gemma 3 c 27 млрд параметров опережает существенно более крупные модели DeepSeek-V3 (671 млрд), Llama 3 405B (405 млрд) и o3-mini.

Модель «из коробки» поддерживает 35 языков, при этом обучающие данные содержали данные на 140 языках. Gemma 3 доступна для коммерческого использования с некоторыми ограничениями. 

Mistral Small 3.1

Французская компания Mistral выпустила обновление своей миниатюрной языковой модели Mistral Small. Размер обновленной LLM составил 24 млрд параметров.

По заявлениям компании, в основных тестах на понимание естественного языка, умение логически рассуждать и писать код новая Mistral Small опережает Gemma 3 с 27 млрд параметров (кроме тестов на математику) и GPT-4o mini.

Из других особенностей выделяется поддержка работы с изображениями, мультиязычность (24 языка), скорость работы, а также возможность использовать модель для дальнейшего обучения режиму «рассуждений».

Модель может быть использована в коммерческих целях без ограничений.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2110👍7
Студенческое средневековье: изучаем базу данных средневековых университетов

Что мы знаем о средневековых студентах? Очень многое! Происхождение, статус и другие характеристики европейских студентов тщательно документировались, так что сегодня ученые могут создавать базы данных выпускников и преподавателей прошлого. Об одной из них — Repertorium Academicum Germanicum — рассказываем в нашем новом материале

Кратко: о чем статья?

Коллективные биографии и данные об исторических личностях позволяют составить «обобщённый социальный портрет» разных сообществ. А изучают их с помощью методов просопографии (мы уже рассказывали о них на примере Японии и Древнего Рима). Проект Repertorium Academicum Germanicum (RAG) использует эти методы для исследования средневековых университетов Европы.

Сегодня в базе можно найти данные около 62 тысяч ученых и выпускников университетов, находившихся на территории Священной Римской империи за 1250–1550 гг. (а также сведения об отдельных деятелях XVII столетия). Каждая запись содержит сведения о датах рождения и смерти, географическом и социальном происхождении, времени обучения и получении ученой степени, деятельности после окончания университета, специальности и перемещениях между университетами.  

Интерфейс сайта позволяет составлять графики и карты, чтобы изучить географию происхождения студентов или типичные маршруты их перемещений между университетами. Например, можно выяснить, что немецкие дворяне-протестанты часто приезжали учиться в Марбург, а особенно сильной тенденция стала в середине XVI в., когда у них не было возможности занимать высокие должности из-за своего вероисповедания. 

Другие опции для исследований — изучение маршрутов отдельных личностей или сетей их коммуникаций. Только за последние пять лет на материалах RAG было опубликовано более 20 исследовательских работ (включая статьи, главы в коллективных монографиях и т.д.).

Узнать подробнее о возможностях, которые предлагает эта база данных, сможете благодаря полной версии статьи.

Время чтения: 8 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥25161
10 из 10: русские писатели в стиле студии Ghibli

Интернет захватила эстетика мультфильмов Миядзаки. Все из-за новой модели внутри ChatGPT, которая хорошо обрабатывает пользовательские картинки. С её помощью в стиле студии Ghibli уже нарисовали почти все знаменитые фотографии, от Сталина на берегу канала Москва-Волга до окровавленного уха Трампа. Мы тоже присоединились — и стилизовали под Миядзаки портреты 10 русских писателей и поэтов/поэтесс. Сможете угадать всех?

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
78👎22👍17😍17🤡5😁4
Коротко и быстро: что такое микрообучение и когда оно (не) может помочь

«Учитесь по 15 минут в день!», «Запоминайте в 2 раза больше!» — маркетологи обещают, что микрообучение изменит ваше образование навсегда. Но что за этим на самом деле стоит? Мы разобрались, как работает этот подход, где он полезен, а где — просто красивая обертка. Спойлер: 5-минутное видео не заменит университетскую лекцию :((((

Что это за подход?

Микрообучение — образовательный подход, при котором новая информация подается небольшими порциями, обычно в формате коротких роликов, презентаций или иллюстрированных текстов. Примеры таких форматов можно встретить все чаще: от познавательных шортсов на YouTube до образовательных VK-клипов. Действительно что-то запомнить из таких видео помогает обязательная составляющая микрообучения — повторяемость.

Как это устроено?


Современные платформы микрообучения зачастую работают по принципу subscription learning — подписки на регулярную подачу небольших учебных фрагментов (так называемых «наггетсов»). Эти мини-уроки включают в себя  объяснение нового материала, проверочные тесты, формы для рефлексии и другие интерактивные элементы. Траектория может быть заранее составлена или формироваться динамически, подстраиваясь под успехи и ошибки ученика.

Кто использует микрообучение?


Многие компании включают микрокурсы в обязательную программу после трудоустройства. Например, внутри Google действует программа Whisper Courses с пятиминутными обучающими модулями. Она направлена на развитие soft skills и помогают выстроить гармоничные взаимоотношения внутри коллектива. По данным Google, всего за десять недель менеджеры-участники Whisper Courses улучшили свои показатели на 22–40 процентных пунктов по сравнению с контрольной группой.

А минусы будут?

Микрокурсы не подойдут для изучения сложных тем или для продвинутых студентов. Выучить первые 50 слов на немецком языке? Да! Разобраться во влиянии экзистенциализма на поэзию Рильке? Вряд ли.
Микрокурсы также не будут одинаково эффективны для разных возрастов и поколений. Исследования показывают, что работники до 40 лет лучше адаптируются к микрообучению, тогда как старшие сотрудники предпочитают лекции и книги.

О других особенностях микрообучения и о том, почему данным об их эффективности, возможно, не стоит доверять на 100%, узнаете из полной версии статьи.

Время чтения: 10 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
28👨‍💻13❤‍🔥9👍8🤓7🔥3🤔1
Пляски вокруг сканера и письма счастья: как новые технологии порождают суеверия

Суеверия — базовая структура человеческого мышления, нерефлексируемые практики и знания, укорененные в нашей когнитивной структуре (а не просто пережиток древнего магического мировоззрения). В новом материале разбираемся, как появляются суеверия при использовании новых технологий.

Кратко: о чем статья?


В 1980-х в США провели эксперимент, чтобы узнать, как лаборанты кабинетов радиологии адаптировались к появлению новой технологии: КT-сканерам, с помощью которых делают томографию.

Если с работой КТ-сканера возникали проблемы, у лаборантов были заготовлены отдельные ритуалы: включить и выключить машину, досконально воспроизвести пройденный путь заново (а лучше несколько раз). С каждой неудачной попыткой решить проблему у них нарастала склонность к магическому мышлению: например, лаборанты могли называть устройства темпераментными или некооперативными.

Дело в том, что им не хватало экспертного знания, а в таких случаях люди стремятся строить объяснение на знакомых объяснительных моделях — на основе ритуалов действий, которые опытным путем доказали свою эффективность.

С 1980-х наши модели поведения едва ли изменились, и в онлайн переходят вполне привычные «офлайновые» суеверия. Так, четыре из десяти пользователей считают, что включение «режима инкогнито» при просмотре веб-страниц делает их действия невидимыми для всех, а двое из десяти опасаются прерывать цепочку «писем счастья».

Подробнее о современных и не слишком суевериях узнаете из полной версии статьи.

Время чтения: 10 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
25🔥16😁10👍3
Новая Llama 4, новый лидер Gemini 2.5 Pro, новые картинки от GPT

Рассказываем, что произошло в мире ИИ за последнее время.

Llama 4

Компания Meta выпустила четвертую версию своей open-source языковой модели LLama. Модель представлена в трех размерах: 2 трлн, 400 млрд и 109 млрд параметров. Все вариации используют архитектуру Mixture of Expert, благодаря которой во время генерации ответа модель задействует только малую долю всех параметров, необходимых для данного запроса. Используемые во время ответа параметры называются активными.

Модели Llama 4 Maverick (400 млрд параметров, 17 млрд активных) и Llama 4 Scout (109 млрд, 17 млрд активных) доступны уже сейчас. Флагманская версия Behemot с 2 трлн параметров (288 млрд активных) находится в процессе обучения. Ее промежуточная версия была использована при создании Maverick и Scout. Все модели поддерживают работу с изображениями.

По основным тестам на понимание языка, программирование и на умение решать логические и математические задачи Scout сопоставима с Gemma 3, Gemini 2.0 Flash-Lite и Mistral Small 3.1. Также Scout поддерживает работу с контентом длиной 10 млн токенов — это особенно полезно при работе с большими кодовыми базами, объемной документацией или видео.

Maverick по метрикам опережает Gemini 2.0 Flash и GPT-4o и сравнима с обновленной DeepSeek-V3 в задачах на логику и программирование. Behemot в задачах, связанных с естественными науками, показывает себя лучше Claude Sonnet 3.7, GPT-4.5 и Gemini 2.0 Pro.

Gemini 2.5 Pro — новый лидер среди LLM

Google представила экспериментальную версию своей новой языковой модели Gemini 2.5 Pro. По большинству ключевых метрик она значительно опережает другие ведущие модели, такие как o3-mini-high, DeepSeek-R1, Grok 3 и Claude Sonnet 3.7.

На платформе LMArena, где пользователи сравнивают различные LLM, Gemini 2.5 Pro занимает первое место (второе — у Llama 4 Maverick). Особенно высоко оцениваются ее возможности в написании программного кода.

Модель доступна через API. Предусмотрены два тарифа: бесплатный — с использованием пользовательских данных для обучения моделей Google и платный — без сохранения и использования данных.

Обновление GPT-4o 

С последним обновлением GPT-4o сильно улучшилось качество генерации изображений. Модель стала рисовать реалистичнее, лучше справляется с отрисовкой текста, а также гораздо эффективнее редактирует изображения — например, может добавлять или удалять объекты, а также применять различные стилизации (например, перерисовывать в стиле студии Ghibli).

Эти улучшения стали возможны благодаря нативной поддержке работы с изображениями. Ранее GPT, как и большинство других моделей, использовала отдельную нейросеть для работы с визуальными запросами. Например, для генерации изображения вызывалась специализированная модель DALL-E 3. Теперь же GPT-4o воспринимает текст и изображения как единый тип данных. Иными словами, она может как принимать изображения на вход, так и генерировать их в ответ, не используя другие модели. Подобный подход к работе с изображениями был также продемонстрирован в моделях Gemini 2.0.

Нативная поддержка изображений и аудио была анонсирована вместе с самой моделью GPT-4o — название «о» происходит от слова Omni, что означает «всё в одном» — универсальность и мультиформатность. Однако полноценный доступ к этим возможностям стал возможен только сейчас.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥19👍1110🏆3
ИИ помогает искать геоглифы в пустыне Наска

Хотя геоглифы Наски известны еще с шестнадцатого века, их изучение началось относительно недавно. В 2023 году искусственный интеллект помог ученым за полгода найти почти такое же количество фигуративных (составляющих изображение) геоглифов, какое было обнаружено за сто лет исследований. «Системный Блокъ» рассказывает, как геоглифы пустыни Наска изучаются с помощью ИИ.

Кратко: о чем статья?

Геоглифы Наска создавались с пятого века до н. э. по шестой век н. э. и хорошо сохранились, потому что плато, на котором они находятся, не затапливалось и не использовалось для сельского хозяйства. Изображения можно условно поделить на две группы: геометрические и образные (фигурные). По способу создания они также делятся на линейные (вычерченные на плоскости) и рельефные (выложенные из гальки). Ученые предполагают, что геоглифы могли создавать, например, для художественного выражения или записи астрономических наблюдений. Другая возможная причина создания геоглифов — ритуальные цели. Эту гипотезу подтверждает расположение линий: многие из них сходятся в одной точке, а также совпадают с подземными источниками воды.

Так как с земли масштаб изображений представить невозможно (средняя длина геоглифа составляет около девяноста метров), исследователи всегда старались смотреть на них «сверху». Ученые снимали геоглифы с воздушных шаров, самолетов, спутников, а также использовали лазерное картографирование LiDAR. С помощью deep learning (глубокого обучения ) исследователи смогли обнаружить частично или полностью скрытые под землей, даже разрушенные памятники. Они обучили модель, которая на карте местности предложила 1309 участков, где большей долей вероятности могли находиться геоглифы. Благодаря ИИ исследователи нашли 303 фигурных и 42 геометрических геоглифов неизвестных ранее.

Применение глубокого обучения также позволило сделать новое наблюдение. Оказалось, что линейные геоглифы в основном изображают диких животных, а рельефные — человеческие мотивы и вещи, связанные с людьми.

Более подробно о том, как искусственный интеллект облегчает работу ученых и помогает сохранять древние изображения, читайте в полной версии статьи.

Время чтения: 14 минут.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
26🔥11🏆9👍5👀1
Digital Humanities Awards 2024: Результаты

Стали известны результаты ежегодной премии DH Awards, цель которой — поощрять интересные ресурсы и проекты в сфере цифровых гуманитарных наук.

«Системный Блокъ» принимал участие сразу в двух номинациях: Best DH Resource (Лучший DH-ресурс) — за наш портал с подборкой материалов по Digital Humanities, и Best DH Data Visualization (Лучшая визуализация данных) — за проект «Классное чтение» о школьном литературном каноне.

В обеих номинациях проекты «Системного Блока» заняли третье место 🎉

Спасибо всем  авторам, редакторам, иллюстраторам и менеджерам, причастным к реализации этих двух проектов, а также читателям, проголосовавшим за нас.

Также поздравляем постоянного автора и блогера СБъ Бориса Орехова, занявшего второе место в номинации DH Short Publication за статью о применении дистрибутивной семантики к шахматам, и автора Ольгу Алиеву, чей курс по компьютерному анализу текста стал призером в номинации DH Training Materials.

С остальными результатами можно ознакомиться по ссылке.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🎉86❤‍🔥26🔥13👍6👏5
Археология памяти. Как цифровые методы помогают исследовать преступления нацистского режима

Сегодня изучать историю холокоста помогают не только привычные археологические методы, но и неинвазивные: лазерное сканирование (LiDAR), аэрофотосъемка, георадарные исследования (GPR) и геофизические методы. Эти технологии позволяют создавать точные карты местности, выявлять скрытые структуры и строить цифровые модели утраченных объектов без необходимости полномасштабных раскопок. 

Кратко: о чем статья?

Новые технологии изменили не только то, как мы видим, например, лагеря смерти, но и то, что мы в них видим, позволив рассматривать лагерь не только как территорию за колючей проволокой, но как объект со сложной инфраструктурой, интегрированный в общество и экономику.

Проект «Ландшафты Холокоста» под руководством Кэролин Старди Коллз — хороший пример системного подхода к археологии нацистских преступлений. В фокусе исследования находятся три очень разных концлагеря: Сильт на британском острове Олдерни, где нацистские преступления долгое время оставались в тени войны; Треблинка — лагерь смерти, от которого нацисты особенно тщательно пытались не оставить следов; и Землин в Белграде, где на территории бывшего лагеря до сих пор живут люди.

Цифровые методы позволили создать детальную трехмерную реконструкцию лагеря Сильт и обнаружить там подземный тоннель, восстановить историю лагеря в Белраде без проведения традиционных раскопок, а в случае Треблинки – обновить карту лагерей и прилегающей к ним территории. 

Подробнее о каждом из этих исследований узнаете из полной версии статьи.

Время чтения: 20 минут


🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
28👍18🔥7
Коллокации и социальная история: как изучение словосочетаний помогает гуманитариям

В самом простом понимании, коллокация — пара часто встречающихся вместе слов (например, «зеленый лист» или «бить ключом»), хотя некоторые исследователи предпочитают называть так только устойчивые словосочетания. Впрочем, признаки «устойчивости» довольно размытые, а эксперименты показали, что интуиция носителей языка не позволяет однозначно выделять коллокации.  Рассказываем об этом феномене подробнее, и изучаем с помощью коллокаций в НКРЯ, что представлял собой антисемитизм в Российской империи второй половины XIX века.

Кратко: о чем статья?

Коллокации, основанные на данных о совместной встречаемости, называются neighbourhood collocations («соседствующие коллокации»), а основанные также на семантических критериях — coherence collocations («когерентные коллокации»). Например, пара слов хлеб насущный будет когерентной, поскольку слова связаны по значению и ассоциированы друг с другом, а вот найденная в корпусе английского языка пара a dog (неопределенный артикль + «собака») будет являться соседствующей, ведь высокая совместная встречаемость обусловлена грамматическими причинами. 

Задача по исследованию разных типов коллокаций значительно упростилась с появлением корпусов: они дали возможность выделять такие словосочетания на основе статистических данных. Такой поиск можно осуществить и с помощью Национального корпуса русского языка (НКРЯ).

Мы решили воспользоваться им для изучения социальной истории и посмотреть на антисемитизм в Российской империи второй половины XIX века. Для этого мы выделили в НКРЯ подкорпус текстов с 1860 по 1900 годы (4108 текстов, 55 298 793 слова). Затем отобрали обозначения для евреев: нейтральные «еврей» и «иудей», грубое «жид». Затем для каждого из этих слов мы рассмотрели коллокации-прилагательные и коллокации-глаголы. Аналогичные запросы сделали и для слова «русский», чтобы посмотреть, связан ли гипотетический антисемитизм с ростом общего интереса к национальности.

Оказалось, что среди прилагательных-коллокатов особенно часто встречались связанные с религией, национальностью и географией. В то же время слово «русский» употреблялось в контексте межнационального и межкультурного общения. 

Многие коллокаты-глаголы для слов «еврей» и «жид» относились к экономической или предпринимательской деятельности («приобретать», «торговать», «содержать», «продать», «заложить»), некоторые с негативным оттенком («надуть», «обмануть»).

Подробнее об этом примере и о том, как и зачем работать с коллокациями с помощью корпусов, узнаете из полной версии статьи.

Время чтения: 12 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥34👍1810
Новинки от OpenAI

Пользователям стали доступны сразу три новых моделей от OpenAI: GPT-4.1, o3 и o4-mini. Рассказываем о них в новом дайджесте новостей из мира ИИ.

GPT-4.1

GPT-4.1 — это  обновление GPT-4o с улучшенными показателями в основных тестах. В контекст модели теперь умещается 1 млн токенов (частей слов или целых слов) — примерно в 8 раз больше, чем у GPT-4o. Это расширяет возможности при работе с объемными кодовыми базами, длинными документами и анализе видео.
Также отмечается улучшение в следовании инструкциям: модель точнее соблюдает заданный формат ответов, корректнее интерпретирует отрицания (например, «Не задавай уточняющие вопросы») и лучше придерживается ограничений по содержанию.

Модель доступна в трех версиях:

• Стандартная GPT-4.1
• GPT-4.1 mini — сопоставим по качеству с GPT-4o, но вдвое быстрей
• GPT-4.1 nano — наиболее быстрая версия

o3 и o4-mini

o3 и o4-mini – новые модели в линейке «рассуждающих» LLM, то есть моделей, которые перед ответом генерируют цепочку рассуждений, повышающую качество финального ответа. o3 была анонсирована ещё в декабре 2024 года, однако на тот момент была доступна только версия o3-mini. o3 теперь может работать с изображениями в процессе рассуждений: увеличивать его части, поворачивать или извлекать текст. В тестах на анализ графиков, схем и других визуальных материалов o3 показывает высокие результаты.

o4-mini — уменьшенная версия еще не представленной модели o4. По характеристикам она превосходит o3-mini и в ряде тестов сравнима с o3, но в целом имеет более ограниченные возможности при меньшей стоимости.

Обе модели поддерживают взаимодействие с другими приложениями: использование браузера для поиска информации, запуск программного кода для вычислений или работы с изображениями, а также использование инструментами, предоставляемыми пользователями.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
22👍11🔥8
2025/07/09 20:31:38
Back to Top
HTML Embed Code: