Telegram Web
И вообще в русском языке сосуществуют два термина: стилеметрия и стилометрия, –  и стоит больших трудов понять, в чем заключается разница (в одной букве).

Наконец-то кто-то набрался смелости это сказать 😅
9🔥7😁2
Есть какая-то богословская шутка в том, что один из самых популярных оптимизаторов в глубоком обучении называется Adam. Вообще-то это акроним, Adaptive Moment Estimation. Но, учитывая, что речь идет об оптимизации функции потерь, то есть уменьшении ошибки, сами понимаете. Первый человек был без греха, а нам остается только оптимизировать. Извините.
20😇10😁5🙏5
RAntiquity
Третий модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) подходит к концу, а значит я снова публикую текст и видео к урокам. Почти весь модуль посвящен деревьям и сетям 🕸️ 1) Тематическое моделирование с LDA (текст, видео). Датасет: новости Lenta.Ru.…
Вчера завершился четвертый модуль «Компьютерного анализа текста» #tar2024 (он же и 2025) — значит, время снова подводить итоги ✍️

Вот что мы успели 🖼️🖼️🖼️:

1️⃣ Пространственные данные (текст, видео). Датасет: римские амфитеатры из Collected Ancient World data sets, на дом — данные Министерства культуры о библиотеках в России 🗺

2️⃣ Регрессионный анализ (текст, видео). Данные из пакета {archdata}: распределение поздней романо-британской керамики, произведенной в Оксфорде 🏺

3️⃣ Регрессионные модели с {tidymodels} (текст, видео). Предсказывали цену амазоновских книг по их названию, а потом провели минихакатон, предсказывая рейтинг отеля по тексту отзыва 📚🏖

4️⃣ Бинарная классификация (текст, видео). Поговорили о линейно-дискриминантном анализе и наивном Байесе, а также воспроизвели знаменитый кейс «Записок Федералиста» в экосистеме {tidymodels}. Давно хотела это сделать 🤓

5️⃣ Многоклассовая классификация (текст, видео). Поговорили о логистической регрессии с регуляризацией и опорных векторах. На занятии классифицировали русских писателей, а на дом отправился небольшой датасет британской прозы) 📉

6️⃣ Глубокое обучение (текст, видео). На новостном датасете из {textdata} изучили полносвязные нейросети и onehot-кодирование. Обучили свою первую модель Keras 🧠🖼️

7️⃣ Приложения Shiny (текст, видео). Использовали обученные прошлый раз препроцессор и модель для строительства небольшого приложения Shiny. Потренировались разворачивать его с Connect Posit Cloud. 🛠

Осталась еще проверка последнего дз и еще некоторые мелочи, но в целом можно уже сказать, что мечта сбылась: от самых основ в сентябре мы плавно подошли к строительству приложений с нейросетевой начинкой 💃

Конечно, многого коснулись только обзорно — и многое мне предстоит дорабатывать летом 🥹, но главная задача решена: показать удивительные возможности языка R вместе с конкретными примерами использования его в гуманитарных исследованиях 📖

Спасибо моим студентам — за неустрашимость и творческий подход к делу.
Please open Telegram to view this post
VIEW IN TELEGRAM
23👏15🔥5
Коллега из ПСТГУ пишет в своем блоге, что раздел по {tmap} пригодился для создания карты римских понтификов. Что ж, я очень рада: и тому, что все понтифики теперь на местах, и тому, что материалы курса оказываются полезны тем, для кого они предназначены 🥳
Please open Telegram to view this post
VIEW IN TELEGRAM
21👏3
This media is not supported in your browser
VIEW IN TELEGRAM
Все побежали — и я побежала. Точнее, погнала: сделала модный bar chart race 🏇на основании публикаций о Платоне в #scopus

🎬 Делюсь секретами создания этой анимации:

🔧 Основные пакеты:
- ggplot2 — строим статичный график
- gganimate — оживляем его
- scales — красивое форматирование чисел
- viridis — стильная цветовая палитра

💡 Ключевые решения:

coord_flip(clip = "off") — переворачиваем график и позволяем тексту выходить за границы

scale_y_continuous(trans = "log10") — логарифмическая шкала сжимает большие различия

transition_states() — плавные переходы между годами с настройкой скорости

geom_text() с динамическим позиционированием — подписи всегда на нужном месте

scale_x_reverse() — ранжируем от 1-го места сверху


Результат: 20-секундное видео, показывающее число страновых аффилиаций по годам в исследованиях Платона 🇷🇺
Please open Telegram to view this post
VIEW IN TELEGRAM
23👍2
🌍 Академический год почти завершен, но до конца июня предстоит еще несколько защит и экзаменов — и заключительный академический рывок, конференция «Reading Plato from the Global South» в Чунцине (Китай) 🇨🇳


🎓 Конференция пройдет под эгидой кафедры ЮНЕСКО ARCHAI (Университет Бразилиа) и Центра китайских и греческих цивилизаций.

🌟 25-27 июня в Юго-западном университете Чунцина соберутся представители платоноведения из 15 стран — от Токийского университета до Бостона, от Университета Буэнос-Айреса до Университета Крита.

🏛️ С коллегами из Ганы, Индии, Бразилии и других стран обсудим новые перспективы понимания античного наследия в том числе через призму незападных философских традиций.

🚀 Замысел этой встречи — создать уникальную глобальную сеть исследований и способствовать развитию платоноведения во всем мире, включая Россию 🇷🇺

👾 По этому поводу планирую представить количественный обзор глобальных трендов в платоноведении; предварительные слайды доступны по ссылке: “Mapping Platonic Scholarship in Scopus: A Bird’s-Eye View

С новостями по теме вернусь, если долечу, уже скоро #plato_mapping #scopus #china2025
10🔥9
Людвиг Витгенштейн в «Голубой книге» замечает по поводу «Теэтета»: Сократ не рассматривает перечисление случаев знания даже как предварительный ответ. В этом Сократ, с его точки зрения, неправ: мы прекрасно можем оперировать понятиями, не зная их точных определений.

Я не могу дать технически строго определения понятия «компьютер» и тем не менее прекрасно обособляю во внешнем мире предметы, которые являются компьютерами; то же самое может быть применимо и к более абстрактным понятиям вроде «знания» или «игра». Для игр может и не быть единого определения: игры в карты, в мяч, в слова или в молчанку обладают в лучшем случае «семейным сходством», и ни одно определение не сможет вместить всех признаков, отличающих игру от других видов активности. Требование Сократа всегда исходить из определения кажется в этом свете не только излишним, но и зачастую невыполнимым.

Можно привести такой пример. Алгоритмы, которые сортируют письма, не нуждаются в определении «спама». Машинное обучение работает так, как говорит Витгенштейн: мы снабжаем метками «спам» или «не спам» некоторое число наблюдений (писем), и по этим наблюдениям машина учится отличать одно от другого, извлекая релевантные признаки. Список этих признаков не задан раз и навсегда, в какой-то спам-рассылке будет слово «наследство», в другой будет слово «сглаз» — это не строгий критерий. Где-то под капотом машина перемножает некие вероятности и возвращает новую вероятность — вероятность, что данное письмо является спамом.

Но есть нюанс. Откуда мы берем метки для исходного датасета? Машина может фильтровать спам, не нуждаясь в определении, но человек, который изначально расставляет метки, имеет какое-то представление о спаме — возможно, не очень ясное или недостаточно артикулированное.

Сократ требует от своих собеседников упаковать это представление в определение и проверяет его примерами. В случае конфликта собеседнику доступно две стратегии: отвергнуть пример или пересмотреть определение (Бернит против Мура на стороне Сократа).

Википедия, например, предлагает такое определение спама:
Спам — это массовая рассылка корреспонденции (чаще всего рекламы) лицам, не выражавшим желания её получить.


Если исходить из этого, большая часть моей рабочей корреспонденции — это спам, потому что я не выражала желания ее получить и вообще ей не рада. Теперь представьте, что вы дали Сократу такое определение, а он показывает вам очередное рабочее письмо с требованием СРОЧНО снова куда-то бежать и что-то заполнять.

Вы, вероятно, захотите уточнить своё определение — добавить «не относящейся к профессиональным обязанностям» или «не связанной с рабочим процессом». Но в этот момент становится очевидно: без стремления к определению мы теряем возможность обсуждать понятие осмысленно, спорить о пограничных случаях, отстаивать различные трактовки и критиковать их. Именно определение — пусть даже неточное и неполное — позволяет нам не просто «размечать» датасеты, а выстраивать рациональный диалог о том, что к понятию относится, а что — нет, и почему.

Витгенштейн прав в том, что мы действительно можем пользоваться словами без строгих определений; но Сократ прав в более глубоком смысле: пока мы не пытаемся осмыслить и критически обсудить значение понятия, мы не отличаемся от алгоритма машинного обучения — просто расставляем метки на примерах, не понимая, что же именно делает их примерами.
👍1572🔥1
open call
проект <—> исследование

Альянс цифровых гуманитарных проектов запускает конкурс проект <—> исследование для тех, кто хочет сделать DH-проекты частью живой инфраструктуры науки, образования и культуры.

🟢 в чём суть конкурса?

Символ <—> в названии конкурса означает, что проекты и исследования связаны. Идея конкурса в том, чтобы делать эту связь между проектами и исследованиями более ощутимой и полезной.

Наша цель — усилить практическую пользу существующих цифровых гуманитарных проектов через исследования, мероприятия или образовательные инициативы.

🔮 кто может участвовать?

— Учёные, преподаватели вузов
— Студенты, аспиранты
— Независимые исследователи
— Сотрудники музеев, библиотек, архивов, галерей
— Культурные менеджеры, урбанисты
— Креативные продюсеры, медиа-менеджеры, журналисты

🟪 в чём задачи участников?

Для участия нужно разработать и описать реализуемую идею, использующую материалы одного или нескольких DH-проектов Альянса, в одной из номинаций:

1. Классическое исследование
2. Интернет-исследование
3. Выставочный/библиотечный/архивный проект
4. Медийный/просветительский проект/мероприятие
5. Образовательная инициатива
6. Critical DH Studies / Ресантимент-анализ

✏️ как поучаствовать?

1. Изучите номинации и проекты Альянса.
2. Разработайте свою идею.
3. Заполните анкету и шаблон заявки на сайте.
4. Ждите обратную связь до 1 августа.

> подробности — на сайте <

что получат победители?

— Консультационную поддержку от ведущих экспертов Альянса.
— Тьюторскую поддержку (помощь в подготовке публикаций).
— Продюсерскую поддержку для реализации вашего плана.
— Рекомендательное письмо для поступления в магистратуры организаторов.

Заявки принимаются до 16 июля 2025 года.

Если у вас есть вопросы о конкурсе, Пишите нам на почту [email protected].
Please open Telegram to view this post
VIEW IN TELEGRAM
🙏3111👍1🔥1💅1
#исследования : как найти дружелюбный язык программирования, плоть идей и самой делать свои инструменты
> мини-интервью с Ольгой Алиевой <

- Оля, расскажи, пожалуйста, почему R? Как получилось, что тебе интересно стало заниматься количественным анализом?
- Изначально мне стало интересно решить одну конкретную задачу, связанную с платоновской стилометрией. Платоноведы часто ссылаются на результаты каких-то количественных исследований, на этом возводятся некие теоретические конструкции — мне захотелось разобраться, как это все устроено, «потрогать руками» — и, главное, проверить несколько собственных гипотез. Прежде чем взяться за дело, я почитала, кто какими инструментами пользуется сегодня для стилометрического анализа, посмотрела примеры проектов из смежных областей — и решила, что мне нужен R. Дальше я начала учиться и втянулась. R — очень дружелюбный язык, с сильным комьюнити, в котором много гуманитариев. Быстро выяснилось, что на R можно делать почти все, так почему бы не попробовать?

- Как это влияет на твою академическую индентичность: философа? филолога? историка мысли? количественной исследовательницы?
- Мне всегда нравилась математическая сторона жизни, и количественные исследования гармонично подружились с моим внутренним платоником. Мне пришлось осваивать основы статистики, вспоминать матанализ, это все удивительным образом позволило заметить и оценить в античной философии те сюжеты, которых я до сих пор, пожалуй, немного побаивалась. Так что филолог и философ во мне не пострадали, скорее наоборот. Вообще жизнь стала более многомерной.

- А что-то из наших проектов в конкурсе выглядит, на твой взгляд, вдохновляющим для большого (или малого) интеллектуального проекта? 
- Я так или иначе сотрудничала с коллегами из разных проектов в этом конкурсе, и больше всего меня вдохновляет, что такие мощные инфраструктурные вещи вообще есть. Наука — это сообщества, а сообщества строятся вокруг содержательной повестки. Конкурс показывает, насколько эта повестка богата и разнообразна. Обретающие плоть идеи — это, со времен творения мира, самое завораживающее зрелище. Mind over matter.

- Я навсегда запомнила твой доклад о том, что не все научные школы одинаково хорошо для квантификации, и некоторые теории придётся сжечь, если мы перейдём в цифровое (или как его там) будущее. Можешь ли привести пример и для наших конкурсантов, чтобы они могли беспокоиться вместе с нами?
- Ха-ха, у меня не было задачи заставить кого-то беспокоиться. Скорее я хотела привлечь внимание к тому, что есть множество областей гуманитарного знания, в которых форсированный «количественный поворот» едва ли принесет какую-то ощутимую пользу. В классической метафизике нечего считать; историко-философская реконструкция как жанр тоже, как ты сказала, очень плохо «квантифицируется» — за пределами узкого круга подходов, которые подвержены колебаниям интеллектуальной моды, вроде автоматического анализа дискурса. Мода приходит и уходит, мы не должны оценивать научные подходы и школы по тому, насколько они преуспели в гонке за искусственным интеллектом.

- Посоветуй, пожалуйста, как начать интересоваться инструментами хотя бы вполовину так увлечённо, как ты? Что почитать, попробовать, покодить?
- Я бы советовала исходить не из инструментов, и из исследовательского вопроса или проектной задачи, можно небольшой или «игрушечной», и уже под нее искать решения и осваивать их. А еще очень важно найти единомышленников, например при помощи Альянса и этого конкурса. Увлечение — вещь очень нестабильная, оно угасает вместе с первыми неудачами, и очень важно, чтобы в этот момент рядом были знающие и доброжелательные коллеги.
🔥18🥰63
Каждый год вот уже около десяти лет я отправляю Люку Бриссону список публикаций о Платоне в России для Bibliographie platonicienne. Обычно прошу о помощи коллег и студентов, потому что публикуют у нас много, и все это надо должным образом собрать и оформить.

Но, после опыта освоения Scopus, OpenAlex & Crossref (писала под тегом #scopus), решила, что ручной труд — это не модно, и пошла искать API от eLibrary (в Скопус попадает далеко не все, что публикуется в России).

И что же вы думаете?

Доступ к одному или нескольким сервисам API осуществляется путем приобретения организацией лицензии сроком на один год. Стоимость подписки на API рассчитывается из учета количества выгружаемых библиографических записей и необходимых полей метаданных. Минимальная стоимость лицензии 30 000 рублей.


Никогда не использую этот эмодзи, но время пришло: 💩💩💩

P.S. Да, я пробовала Perplexity и другие модные ИИ-штуковины, они не справляются, нужна человеческая голова.
💔165😁3💩2
📖От древних текстов к алгоритмам: философские исследования в цифровую эпоху

📌Сегодня философы активно используют цифровые инструменты, чтобы анализировать тексты и находить в них закономерности. Чтобы глубже разобраться в этой теме, мы поговорили с Ольгой Алиевой — доцентом Школы философии и культурологии и автором телеграм-канала «RAntiquity».

Если вы хотите узнать, как технологии меняют понимание Платона и какие цифровые инструменты сейчас в тренде — заглядывайте в карточки!

#DigitalHumanities #нашипреподаватели
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
18
2025/07/09 04:38:12
Back to Top
HTML Embed Code: