Telegram Web
Неравенство, женщины в DH и гендерная социолингвистика

Продолжаем праздновать Международный женский день! Собрали для вас подборку полезных и познавательных публикаций, в которых мы напоминаем о сферах, где все еще сохраняется неравенство, изучаем, чем занимаются DH-исследовательницы, и ищем различия между мужской и женской речью.  

👩‍💻 Женщина и программист: исследуем гендерное неравенство в IT-сфере

Несмотря на быстрый рост рынка и востребованность специалистов, проблема гендерного неравенства очень заметна в сфере IT. Мы изучили, какова доля женщин среди профессионалов в области информационных технологий, сколько девушек готовы обучаться компьютерным наукам в России и какие стереотипы ограничивают их на рынке труда.

👨🏻‍🏫 Учителя-мужчины в школе: сколько их и что они преподают

Мы проанализировали открытые данные Минпросвещения и выяснили соотношение мужчин и женщин среди учителей. Насколько силен гендерный дисбаланс в профессии, насколько ситуация различается между российскими регионами и зависит ли доля мужчин и женщин от преподаваемого предмета (спойлер: ОБЖ — самый мужской предмет, Русский язык и литература — самые женские), читайте в нашей дата-истории. 

👩🏻‍🔬 «Игнорируется и не ценится»: вклад женщин в науку через цифры

Если в сфере школьного образования женщин больше, чем мужчин, то в науке дело обстоит по-другому. Здесь женщины иногда оказываются невидимыми. Почитайте нашу статью о работе ученых из Северо-восточного университета в Бостоне и вы узнаете, с какими проблемами сталкиваются исследовательницы, когда речь идет просто об указании авторства. 

👩🏼‍🎓 От первого лица: исследовательницы о своей работе

Если проблемы гендерного неравенства вас расстраивают, почитайте наши интервью с исследовательницами гуманитарных наук. Мы говорили об искусственном интеллекте — с Татьяной Шавриной, руководительницей исследовательской команды в проекте LLAMA, о нейролингвистике — с Ольгой Драгой, директоркой Центра языка и мозга НИУ ВШЭ, о цифровизации аудиоархивов — со Светланой Подрезовой, заведующей Фонограммархивом Пушкинского Дома.

🕵🏽‍♀️ Тест: Знаете ли вы различия между мужской и женской речью

И в завершение — пройдите наш тест, основанный на результатах исследований в области гендерной социолингвистики. Из него вы узнаете, кто — мужчины или женщины — чаще использует абстрактную лексику или слова-паразиты и больше следит за правильностью речи.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Огромная GPT, новая модель от Anthropic и OCR от Mistral

Рассказываем, что произошло в мире ИИ за последнее время.

Новая GPT — большая, человечная и дорогая

Компания OpenAI представила новую версию своей языковой модели — GPT-4.5, обновление ранее выпущенной GPT-4o. В отличие от моделей линейки «o», ориентированных на решение сложных задач в области точных наук, в GPT-4.5 сделали упор на естественность ответов и на эмоциональный интеллект — это подтверждается первыми реакциями пользователей. Также модель меньше подвержена галлюцинациям.

По словам компании, версия 4.5 — их самая большая модель на данный момент. Правда, ее размер сказался на скорости генерации ответа — она существенно медленнее GPT-4o. Кроме того, использование GPT-4.5 обходится в десятки раз дороже аналогичных моделей: стоимость обработки миллиона входных токенов составляет $75, а миллиона выходных — $150, что в 30 и 15 раз превышает стоимость GPT-4o соответственно.

Обновление Claude Sonnet

Компания Anthropic, один из главных конкурентов OpenAI, выпустила обновление своей языковой модели — Claude Sonnet 3.7.

Главным нововведением стала поддержка режима рассуждений, при котором модель генерирует длинные цепочки логических выводов, существенно повышающие качество финального ответа. В отличие от конкурентов, Anthropic не стала разрабатывать две отдельные модели — одну для быстрых ответов, другую для ответов с предварительными рассуждениями, а объединила оба режима в одной модели.

В обоих режимах Claude Sonnet 3.7 либо превосходит конкурирующие модели, либо демонстрирует сопоставимые результаты. Особенно заметное преимущество наблюдается в задачах, связанных с программированием.

Цены у Sonnet 3.7 такие же, как и прошлой версии: $3 за миллион входных токенов и $15 за миллион выходных.

Anthropic была основана выходцами из OpenAI. В качестве приоритета компания считает разработку безопасного и интерпретируемого ИИ. По заявлениям гендиректора Anthropic, появление общего искусственного интеллекта можно ожидать уже к 2027 году.

Сервис для OCR от Mistral

Французская компания Mistral представила сервис для распознавания текста на фотографиях и сканах (OCR). Модель способна распознавать не только текстовую информацию, но и таблицы, изображения, графики и формулы.

По качеству распознавания сервис Mistral превосходит аналогичные решения от Google, Microsoft и OpenAI. Особое внимание разработчики уделили мультиязычности: модель нативно поддерживает письменности на основе латиницы, кириллицы и многие азиатские системы письма.

Сервис также позволяет использовать цифровой документ в качестве промта — пользователи могут задавать модели вопросы по содержанию или извлекать из документа необходимую информацию в структурированном виде (например, в формате JSON).

Доступ к сервису предоставляется через API по цене $1 за 1000 страниц. Для клиентов, которым важна конфиденциальность данных, есть возможность развернуть модель на собственных серверах.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Как 3D-моделирование спасает памятники древнерусской письменности: «Corpus Inscriptionum Rossicarum»

Могут ли новые технологии помочь прочесть нечитаемую древнюю надпись на камне? Как трехмерные модели старинных надгробий, крестов, камней и эпиграфических табличек позволяют не только сохранить эти памятники в цифровой форме, но и добыть новое знание о прошлом? Знакомимся с проектом «Свод русских надписей», проблемами работы эпиграфистов и методами их решения.

Благодарим за помощь в написании материала сотрудника проекта «Свод русских надписей» Анну Зиганшину

Кратко: о чем статья?

Изучением надписей на твердых материалах в России занимаются очень давно: истоки эпиграфики (науки о таких текстах) прослеживаются ещё в в XVI-XVII веках, когда появились первые подробные описания святынь, надгробий и памятников архитектуры. А в XIX веке появились первые эпиграфические своды, куда также вошли письменные источники об изучаемых надписях. Например, черновики текстов памятников и учетные монастырские записи.

Сегодня назревает необходимость в унифицированной публикации и републикации как известных, так и ранее неизвестных памятников, а также тех, которые сохранились в ранних сведениях, но ныне утрачены. Эту задачу призван решить проект «Свод русских надписей».

Участники проекта используют для составления свода современные цифровые технологии: трехмерное моделирование — на этапе документирования объектов — и ГИС и базы данных — на этапе систематизирования учетных данных о надписях. Эти методы значительно расширяют возможности исследователя при подготовке публикации. Но работа «Свода» не кончается на моделировании — необходимо также создать высококачественные рендеры и применить к моделям алгоритмы визуализации текста. Это позволяет прочитать даже те надписи, которые не слишком хорошо сохранились или дошли до современных ученых в поврежденном виде.

Сегодня в базе «Свода» можно найти 2075 документированных плит и фрагментов от 1905 памятников, 1597 моделей памятников, 1424 подготовленные к исследованию надписи и 864 описания надписей.

Подробнее о процессах работы «Свода» и технологических горизонтах проекта можно узнать из полной версии статьи. Там же найдёте примеры древних памятников, которые изучают с помощью условных цветовых схем, рассчитанных математическими алгоритмами, и других цифровых методов.

Время чтения: 16 минут


🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Технологии в Большом египетском музее: 3D-модели, VR и цифровой двойник

Большой египетский музей (The Grand Egyptian Museum, или GEM) — один из самых многообещающих долгостроев в сфере культурного наследия. Его история началась еще в 2002 году, а первым экспонатом стала 11-метровая гранитная статуя Рамзеса II, размещённая в главном холле музея с помощью виртуальной 3D-копии. Рассказываем, как цифровые инновации вписались в проектирование и строительство музея.

Кратко: что за музей?

GEM — самый большой археологический музей и самый большой музей, посвященный одной цивилизации. Официально он откроется 3 июля 2025-го, но 12 залов постоянной экспозиции уже доступны посетителям.

Цифровые технологии сопровождали музей на протяжении всего строительства, но главным новаторством в архитектурном проекте стало применение технологии digital twin. Это создание полной динамически обновляемой виртуальной модели всего музейного комплекса и его окрестностей. Благодаря ней все люди, занятые в строительстве, оставались в курсе ежедневных изменений, неизбежных для работ подобного (огромного!) размаха. Вместе с реальной постройкой рос и ее двойник.

Другие технологии призваны разнообразить опыт посетителей музея. Например, с официальным открытием в GEM должны стать доступны VR-реконструкция гробницы, 3D-модель Сфинкса и виртуальная лодочная прогулка вдоль Нила времени фараонов.

Подробнее о том, как цифровые технологии помогли сделать проекта музея менее дорогим, но более экологичным и интересным посетителю, узнаете из полной версии статьи.

Время чтения: 11,5 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Искусственный интеллект в помощь благотворительности

Технологии способны облегчить изматывающий труд благотворительных организаций: найти доноров, помочь с заявкой на грант или спрогнозировать социальные изменения. «Системный Блокъ» рассказывает, в чем цифровые интсрументы полезны в мире добрых дел и почему это сопряжено с рисками.

🤖 Как часто НКО используют ИИ?

Поворот НКО в сторону современных технологий идет не быстро, однако некоторые организации уже активно ими пользуются. Например, в 2024 году для подачи заявки на грант в Фонд Потанина ИИ использовала почти половина опрошенных НКО: искусственный интеллект помог сформулировать цели и задачи проекта, посчитать и описать качественные и количественные показатели, создать шаблон писем для партнеров.

Тем не менее, так было не всегда. Например, как в России, так и за рубежом НКО медленно осваивают технологии, редко используют современные инструменты, такие как чат-боты и искусственный интеллект.

💸 С чем ещё может помочь ИИ?

Платформа Grantable может сгенерировать текст для грантовой заявки, а для большей точности и этичности формулировок можно использовать инструмент AI Grant Writer.

Незаменимым инструментом ИИ может стать и для повышения эффективности фандрайзинга: он может выявить потенциальных крупных доноров на основе анализа данных из внешних и внутренних источников, а ещё — помочь донорам выбрать программу или организацию для пожертвования с учетом прошлых отчислений.

⚠️ Что важно учитывать?

Применение искусственного интеллекта сопряжено с определенными рисками. Например, сгенерированные изображения или видео могут вызвать недоверие к работе НКО у потенциального донора. Кроме того, для обучения качественных и полезных алгоритмов нужно большое количество хороших данных, которых в сфере НКО часто недостаточно.

Более подробно о том, с какими проблемами могут столкнуться НКО, как чат-боты способны облегчить сбор пожертвований и работу сотрудников, и почему использование ИИ в сфере благотворительности не всегда оптимально, читайте в полной версии статьи.

Время чтения: 11 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Подборка про историю интернета

В новой подборке рассказываем, как писатели в начале XX века предсказали интернет, как в Советском Союзе пытались создать суверенную электронную сеть и почему советские и русские программисты стали цениться во всем мире.

Как писатели XIX века предсказали мессенджеры, интернет на Марсе и нейросети

1908 год. Упал Тунгусский метеорит, родился лауреат Нобелевской премии Лев Ландау, Сергей Дягилев представил Русские сезоны в Париже. А еще в этом году вышла книга Александра Богданова «Красная звезда». Фантаст описал распределенную информационную систему для сбора статистики на Марсе, которая сильно напоминает интернет.

Интернет на службе коммунизма: как СССР создавал свою электронную сеть

В 60-е гг. XX века в СССР кибернетика из лженауки стала популярной идеей. Читайте в нашем материале про утопичный проект Общегосударственной автоматизированной системы учета и обработки информации (ОГАС) для создания идеального коммунистического будущего.

Утечка в IT: как эмигранты создали бренд русского программиста

В 2007 году президент Intel Russia Стив Чейз заявил: «Если проблема нерешаема, мы передаем ее русским». Это высказывание подчеркнуло высокую репутацию российских программистов на мировом IT-рынке. Рассказываем, как советские и русские программисты стали мировым брендом.

Прокачиваем гуманитария до программиста: инструкция

И бонус! Читайте наш гайд, как из филолога, культуролога, философа — одним словом, гуманитария — стать программистом. Рассказываем, как направить себя, к чему быть готовым и какие ресурсы использовать, если вы увлеклись идеей программирования, но не знаете, с чего начать, и не уверены, сможете ли вы.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Digital Humanities Awards 2024: две номинации «Системного Блока»

Привет, это команда «Системного Блока»! Сегодня делимся хорошими новостями, рассказываем про важную премию и обращаемся с небольшой просьбой, но обо всём по порядку!

🎉 Новости

«Системный Блокъ» номинирован на ежегодную премию DH Awards сразу в двух категориях: Best DH Resource (Лучший DH-ресурс) — за наш портал с подборкой материалов по Digital Humanities, и Best DH Data Visualization (Лучшая визуализация) — за проект «Классное чтение» о школьном литературном каноне.

🏆 Премия

DH Awards вручается ежегодно с 2012 года, это профессиональная общественная премия в области Digital Humanities. В этот раз в ней семь номинаций: от большой и, пожалуй, главной, Best DH Resource до Best Use of DH for Fun. Основная цель этой премии — популяризировать цифровые методы в гуманитарных науках и показать, насколько разными могут быть проекты в этой сфере, поскольку награды не зависят ни от языка, ни от географии, ни от темы проекта.

👉👈 Просьба

Победители премии определяются голосованием, так что у нас есть простая и очевидная просьба — если вам нравятся наши спецпроекты, пожалуйста, проголосуйте за них до 4 апреля.

А мы напомним, что на странице точки входа в DH собрали статьи, блоги, глоссарий и рекомендации экспертов в этой области. Ну а в серии материалов «Классное чтение» рассказали о том, как менялся состав зарубежной, региональной и русской литературы в школах от Октябрьской революции до наших дней.

👣 Четыре простых шага 👣

1. Открыть голосование
2. Найти и выбрать Classroom reading (Systemniy Block media) в категории BEST DH DATA VISUALIZATION
3. Найти и выбрать Digital Humanities, или Цифровые методы в гуманитарных науках: точка входа в категории BEST DH RESOURCE
4. Отправить форму!

Спасибо, что читаете и поддерживаете ❤️

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
На словах или на деле? Подборка про Льва Толстого в цифровой гуманитаристике!

Лев Толстой — один из самых значимых русских писателей, чье влияние выходит далеко за пределы литературы. Именно его мы упоминали в канале «Системного Блока» чаще всех остальных русских классиков в прошлом году (и едва ли что-то поменяется в этом). В новой подборке собрали для вас наши главные материалы о Толстом.

📚 Цифровые ресурсы 📚

На нашем сайте регулярно выходят статьи, в которых мы рассказываем об онлайн-архивах произведений Толстого. Например, из обзора интернет-ресурсов о писателе можно узнать о семантическом издании «Толстой Digital» и о проекте «Слово Толстого», который открывает читателю доступ к 90-томному собранию сочинений. Подробнее об этом проекте Анастасия Бонч-Осмоловская рассказала в своем интервью.

💻 Цифровые исследования 💻

Цифровые методы позволяют изучить неочевидные аспекты творчества Толстого: например, благодаря корпусной лингвистике мы можем узнать что говорит о персонажах «Войны и мира» их речь.

Векторно-семантические модели помогут изучить стиль писателя и увидеть, что слова «обожать» и «боготворить» в его текстах свидетельствуют о чувствах ложных и зыбких, а «любят» у классика по-настоящему. А изучение других глаголов подскажет, какие действия чаще характеризуют женщин и мужчин в текстах русских писателей (спойлер: в случае Толстого женщины чаще всего улыбаются и плачут, а мужчины — понимают и кричат).

😎 Бонус! Тесты 😎

Для тех, кто хочет проверить знания о Толстом (а иногда и о себе!), мы создали несколько тестов. Например такие:

Вы Лев Толстой на словах или на деле? Викторина по редким словам из корпуса текстов писателя — узнайте, насколько хорошо вы понимаете редкие слова из его произведений.

С какими героями «Войны и мира» вы говорите на одном языке? — определите, чей стиль речи вам ближе всего. 

Ещё больше наших материалов о Толстом — на его персональной странице на сайте.

😎 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
OpenAI против китайского ИИ, новая open-source модель от Google и Mistral Small

Рассказываем, что произошло в мире ИИ за последнее время.

OpenAI против китайского ИИ

В рамках инициативы администрации Трампа AI Action Plan компания OpenAI предложила изменить правила экспорта вычислительных чипов американского производства. AI Action Plan — это инициатива, в которой могут участвовать компании, научные организации и политики, предлагая свои идеи по стратегическому развитию ИИ в США. По итогам обсуждений будет сформирована государственная политика, направленная на «укрепление позиций Америки» в глобальной конкуренции в сфере ИИ.

Вместо полного запрета экспорта чипов в некоторые страны предлагается разрешить поставки при условии, что дата-центры не будут использоваться для работы китайских моделей ИИ. Такое ограничение обусловлено опасениями OpenAI, что китайские разработки вынуждены подчиняться требованиям правительства КНР, что может привести к утечке пользовательских данных при использовании китайских моделей.

Сейчас Китай — главный конкурент США в ИИ-гонке. Китайские компании и лаборатории вносят существенный вклад в развитие ИИ за счет публикации передовых моделей и подробной технической документации в открытый доступ. Многие корпорации используют китайские модели как основу: в частности, последние языковые модели Яндекса и Т-Банка являются дообученными версиями Qwen2.5, разработанной Alibaba Group.

Gemma 3 — обновленная open-source LLM от Google

Компания Google обновила свою open-source языковую модель Gemma.

Третья версия модели доступна в четырех размерах: 1, 4, 12, 27 млрд параметров. Все модели, кроме самой маленькой, поддерживают обработку текста и изображений, версия с 1 млрд параметров умеет работать только с текстом.

По оценкам пользователей LMArena, где каждый желающий может сравнить ответы разных LLM, Gemma 3 c 27 млрд параметров опережает существенно более крупные модели DeepSeek-V3 (671 млрд), Llama 3 405B (405 млрд) и o3-mini.

Модель «из коробки» поддерживает 35 языков, при этом обучающие данные содержали данные на 140 языках. Gemma 3 доступна для коммерческого использования с некоторыми ограничениями. 

Mistral Small 3.1

Французская компания Mistral выпустила обновление своей миниатюрной языковой модели Mistral Small. Размер обновленной LLM составил 24 млрд параметров.

По заявлениям компании, в основных тестах на понимание естественного языка, умение логически рассуждать и писать код новая Mistral Small опережает Gemma 3 с 27 млрд параметров (кроме тестов на математику) и GPT-4o mini.

Из других особенностей выделяется поддержка работы с изображениями, мультиязычность (24 языка), скорость работы, а также возможность использовать модель для дальнейшего обучения режиму «рассуждений».

Модель может быть использована в коммерческих целях без ограничений.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Студенческое средневековье: изучаем базу данных средневековых университетов

Что мы знаем о средневековых студентах? Очень многое! Происхождение, статус и другие характеристики европейских студентов тщательно документировались, так что сегодня ученые могут создавать базы данных выпускников и преподавателей прошлого. Об одной из них — Repertorium Academicum Germanicum — рассказываем в нашем новом материале

Кратко: о чем статья?

Коллективные биографии и данные об исторических личностях позволяют составить «обобщённый социальный портрет» разных сообществ. А изучают их с помощью методов просопографии (мы уже рассказывали о них на примере Японии и Древнего Рима). Проект Repertorium Academicum Germanicum (RAG) использует эти методы для исследования средневековых университетов Европы.

Сегодня в базе можно найти данные около 62 тысяч ученых и выпускников университетов, находившихся на территории Священной Римской империи за 1250–1550 гг. (а также сведения об отдельных деятелях XVII столетия). Каждая запись содержит сведения о датах рождения и смерти, географическом и социальном происхождении, времени обучения и получении ученой степени, деятельности после окончания университета, специальности и перемещениях между университетами.  

Интерфейс сайта позволяет составлять графики и карты, чтобы изучить географию происхождения студентов или типичные маршруты их перемещений между университетами. Например, можно выяснить, что немецкие дворяне-протестанты часто приезжали учиться в Марбург, а особенно сильной тенденция стала в середине XVI в., когда у них не было возможности занимать высокие должности из-за своего вероисповедания. 

Другие опции для исследований — изучение маршрутов отдельных личностей или сетей их коммуникаций. Только за последние пять лет на материалах RAG было опубликовано более 20 исследовательских работ (включая статьи, главы в коллективных монографиях и т.д.).

Узнать подробнее о возможностях, которые предлагает эта база данных, сможете благодаря полной версии статьи.

Время чтения: 8 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
10 из 10: русские писатели в стиле студии Ghibli

Интернет захватила эстетика мультфильмов Миядзаки. Все из-за новой модели внутри ChatGPT, которая хорошо обрабатывает пользовательские картинки. С её помощью в стиле студии Ghibli уже нарисовали почти все знаменитые фотографии, от Сталина на берегу канала Москва-Волга до окровавленного уха Трампа. Мы тоже присоединились — и стилизовали под Миядзаки портреты 10 русских писателей и поэтов/поэтесс. Сможете угадать всех?

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/03/30 13:21:17

❌Photos not found?❌Click here to update cache.


Back to Top
HTML Embed Code: