Telegram Web
RAntiquity
За проезд не забываем передавать! — У Лондиниума остановите, пожалуйста! данные: orbis графика: ggplot палитра: brutal #цифровые_этюды #spatial_data
кстати, после нескольких дней возни с картографическими проекциями, должна сказать, что вместе с дарвином пусть тогда уж забирают круглую землю. я согласна на плоскую 🐢🐘🐘🐘
😁15
Сегодня читали Эразма под руководством Мары Тимощук @thalatta_thalassa. Это был прекрасный семинар на живой латыни, но пост не об этом.

Есть такой датасет “Словарь русских писателей XVIII века: сеть персоналий” Это прекрасный датасет, подготовленный Борисом Ореховым @nevmenandr, но пост тоже не об этом.

Там собраны междустатейные ссылки в Словаре русских писателей XVIII века (1988–2010. Вып. 1–3). Узлами сети выступают посвященные персоналиям статьи словаря, а ребрами — ссылки на другие статьи в том же словаре. Но сейчас речь не об этом.

И вот, там 780 персоналий, и все они друг с другом как-то связаны. Но есть две странные изолированные пары.

Стало мне интересно, что это за несчастные, на которых ни одна статья не ссылается и их статьи тоже ни с кем не связаны.

Оказалось, что один из них -- Иоганн-Вернер Паузе, переводчик Эразма и Яна Коменского на русский. Вот о нем я и хотела написать.
15😁4
Почему так мало амфитеатров в Греции? А ведь были буквально родиной амфитеатров.

данные: римские амфитеатры
графика: tmap

#цифровые_этюды #spatial_data
👍4
Forwarded from HSE R Meet Up
Всем привет!

Мы рады сообщить о запуске проекта HSE R Meet Up! Это пространство для обмена знаниями и опытом в мире анализа данных с использованием языка R. Наша цель — создать сообщество, где каждый сможет углубить свои навыки в data science, обсудить прикладные вопросы и новинки из этой области, а также найти единомышленников.

🔍 Что вас ждет?
- Мастер-классы от экспертов по разным методам анализа данных.
- Совместное решение и обсуждение реальных кейсов.
- Возможность делиться своими проектами и получать обратную связь.

Мы встречаемся как в очном формате, так и онлайн в Москве, Санкт-Петербурге и Перми.

В этом Telegram-канале мы будем публиковать анонсы мероприятий и всю актуальную информацию.

Let's RMeetUp ~ 🚀
9❤‍🔥4👍1
library(imager)
img <- load.image("https://upload.wikimedia.org/wikipedia/commons/thumb/a/ae/Aristotle_Altemps_Inv8575.jpg/1024px-Aristotle_Altemps_Inv8575.jpg")


# цветовые каналы
ar.red <- img
G(ar.red) <- 0
B(ar.red) <- 0

ar.blue <- img
R(ar.blue) <- 0
G(ar.blue) <- 0

ar.green <- img
R(ar.green) <- 0
B(ar.green) <- 0

ar.yellow <- img
B(ar.yellow) <- 0


library(purrr)
par(mfrow = c(2,2))
walk(list(ar.red, ar.blue, ar.green, ar.yellow), plot,
axes=FALSE)


#images #цифровые_этюды
👾5🔥3
RAntiquity
Почему так мало амфитеатров в Греции? А ведь были буквально родиной амфитеатров. данные: римские амфитеатры графика: tmap #цифровые_этюды #spatial_data
В общем, объяснение нашлось, и это не ошибка в сборе данных.

By comparison with the West, there are far fewer purpose-built amphitheaters known in the eastern Roman provinces. This has been traditionally explained by the idea that the Greek East was more “civilized” than Italy and the Western Provinces, and therefore would not have indulged in the kind of blood sports these structures accommodated.


Греки не любили, значит, мордобой, им новые сезоны нетфликс не заходили. Уважаю.
8😁5👍3🕊1
Forwarded from Antibarbari HSE (полина крупинина)
📘В свежем выпуске журнала "Философия. Журнал Высшей школы экономики" вышла статья нашего редактора Ольги Алиевой "Pseudoplatonica: блеск и нищета стилометрии”.

🔎Откуда в платоновском корпусе тексты, написанные не Платоном, и правильно ли считать их "подложными"?

🔎Почему количественные методы атрибуции авторства не могут достоверно установить, какие тексты считать подлинными?

🔎Достаточно ли "аномальной" статистики для того, чтобы усомниться в авторстве диалога?

Обо всем этомс картинкамичитайте по ссылке.
❤‍🔥10
Отличный ресурс. Есть греческий и латынь, включая средневековье.

The CLARIN infrastructure offers access to 76 historical corpora, covering almost all of the languages spoken in countries that are either members or observers in CLARIN ERIC. In the vast majority of cases, the corpora can be directly downloaded from the national repositories or queried through easy-to-use online search environments. They are also richly tagged and mostly available under public licences.
8
RAntiquity
Отличный ресурс. Есть греческий и латынь, включая средневековье. The CLARIN infrastructure offers access to 76 historical corpora, covering almost all of the languages spoken in countries that are either members or observers in CLARIN ERIC. In the vast…
Оказалось при этом, что латинский корпус от II до н.э. до XX н.э. хранится там в формате “вертикальный корпус”, странная история для хранения корпусов в Sketch Engine. Это и не html, и не xml, и вообще не пойми что, что безболезненно прочитать в R не получится.

Так что суббота проходит в попытке написать сложный парсер, который превратит эту штуковину на 13 млн токенов в дружелюбный тиббл. Есть даже парочка идей, как его потом использовать.

Our metadata cover author, title of the work, genre (prose or poetry), era, date of the work (when available), and century. The oldest text in our corpus are the Senatus consulta de Baccanalibus (186 B. C.), and the most recent one is Dominus Iesus (2000), by the Vatican Congregation for the Doctrine of the Faith.
🤯31👍1
Недавно обратила внимание, что в замечательной, в общем-то, книжке Эмиля нашего Хвитфельдта и Джулии нашей Силги (про машинное обучение для текстовых данных) выражение let’s встречается в среднем 1-3 раза на разворот.

Давайте построим нашу первую линейную модель! Давайте добавим токенизацию в препроцессор! Давайте изменим штрафные коэффициенты гребневой регрессии!


Давайте! Мне все это очень нравится. Последний раз я читала книжки с таким количеством призывов к действию, когда дети были маленькие, и их литература постоянно побуждала нас всех спеть песенку! похлопать в ладошки! помочь ежику добраться до домика!

Теперь мне 40 лет, и такое чувство, что я на месте младенца. Куда нажать, чтобы включилась поощрительная музыка?
🥰187🔥5👍1
Forwarded from Antibarbari HSE (Olga Alieva)
🪩 15 октября в НГУ состоится “Школа молодого антиковеда”.

🪲 Для получения онлайн-ссылки на подключение необходимо заранее зарегистрироваться здесь.

💎 Для участия в дистанционном мастер-классе О. В. Алиевой необходимо заранее установить R & RStudio (или зарегистрироваться в облаке Posit). Инструкция, как это сделать, здесь.

🦕 Будем рады видеть друзей-антиковедов, молодых и не очень!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤‍🔥21
Очень интересный эксперимент (2023) по датировке греческих документальных папирусов с использованием регрессионных методов (GitHub).

Многое скажет сердцу эллиниста табличка, в которой приведены правила нормализации греческого текста.

Результат неплохой, надо бы попробовать повторить.
🔥7👏2
Не совсем моя тема, но интересно как пример использования нейросетей в антиковедении. Автоматическая классификация римских монет (код, модель, датасет по ссылке). Красивое.

P.S. Вот здесь группа товарищей тоже классифицирует римские монетки и делится данными, но там что-то связанное с теорией игр.
🔥13👏1
Попросила Chat GPT рассказать сказку на ночь. О преподавателе латинского языка, в духе Пелевина.

Его звали Евграф Сантименталов, и он был доцентом кафедры классической филологии провинциального университета. Каждое утро он надевал твидовый пиджак с латками на локтях и отправлялся в аудиторию, чтобы погрузить студентов в мир древнеримской мудрости.

Но Евграф знал, что это всего лишь иллюзия - мир латинских спряжений и склонений был лишь тонким покровом, скрывающим бездну экзистенциального одиночества. За напускной серьезностью академического дискурса он видел лишь безумие и абсурд человеческого существования.

На своих занятиях Сантименталов незаметно вводил студентов в состояние легкого гипноза, погружая их в бесконечные парадигмы и правила латинской грамматики. "Учите, учите, несчастные", - шептал он, наблюдая, как их взгляды стекленеют. В эти моменты ему казалось, что он приоткрывает завесу тайны, показывая им, что вся их жизнь - всего лишь набор условных рефлексов.

Но однажды один из его студентов, Ипполит Тараканов, взял и задал Евграфу неожиданный вопрос: "А что, если мы все - просто персонажи в очередном романе Пелевина?" Сантименталов вздрогнул, словно его застали врасплох. Он понял, что игра окончена, и теперь ему придется искать новые способы поддержания иллюзии.

С тех пор Евграф Сантименталов стал еще более отстраненным и меланхоличным, а его лекции о падежах и спряжениях звучали все более абсурдно и бессмысленно. Но студенты продолжали слушать его, смутно подозревая, что за этим кроется что-то большее - то ли тайна бытия, то ли просто очередная игра разума.


Ну теперь вы поняли, почему Пелевин стал так часто новые романы выпекать.
😁22🤔4
Forwarded from Vox medii aevi
Продолжаем рубрику «сегодня я узнала»: оказывается, уже ДВА ГОДА как можно подать заявку в консорциум CREMMA и получить доступ к eScriptorium (это такая платформа для автоматической транскрипции рукописей). Нужно только описать свой проект и пообещать поделиться тренировочными данными.
Сайт на французском
🔥51👍1
Antibarbari HSE
🪩 15 октября в НГУ состоится “Школа молодого антиковеда”. 🪲 Для получения онлайн-ссылки на подключение необходимо заранее зарегистрироваться здесь. 💎 Для участия в дистанционном мастер-классе О. В. Алиевой необходимо заранее установить R & RStudio (или…
Спасибо, всем, кто слушал, вот ссылка на статью про дельту, которую я несколько раз сегодня упоминала. Там есть некорые выводы относительно приемлемой длины отрезка и числа mfw, необходимых для классификации.

У этой статьи было продолжение, в котором я выяснила, что косинусная (вюрцбургская) дельта работает на греческих текстах лучше, чем классическая. Но эта статья, увы, застряла в печати, поэтому ссылка только на препринт.

А самое главное понять (как я поняла лишь сравнительно недавно), что так называемая дельта — это не что иное, как метод машинного обучения под названием k-nn (метод ближайших соседей) при k = 1 на стандартизированных данных с манхэттенским расстоянием. Поэтому все это можно делать без stylo в библиотеке tidymodels (о чем в курсе по R) обязательно будет добавлен урок.

Почему tidymodels, а не stylo? Потому что, во-первых, это опрятно. Во-вторых, есть возможность провести перекресную проверку на разных выборках с разными параметрами (пакет rsample), оценить модели при помощи yardstick и автоматически отобрать лучшую.

Но это без кодинга не решается, и для тех, кто не хочет кодировать, stylo — вполне достойная замена.
7👍2😱2
RAntiquity
Спасибо, всем, кто слушал, вот ссылка на статью про дельту, которую я несколько раз сегодня упоминала. Там есть некорые выводы относительно приемлемой длины отрезка и числа mfw, необходимых для классификации. У этой статьи было продолжение, в котором я выяснила…
Самое лучшее объяснение алгоритма knn я видела в книге Бретта Ланца “Машинное обучение на R” (русский перевод весьма пристойный).

Он, в частности, говорит о том, что это алгоритм ленивого обучения, т.к. машина на самом деле ничему не учится, а просто запоминает тренировочные данные. Тут-то я и осознала, что это дельта и есть.

Поэтому, если вы вдруг не понимаете смысл дельты, рекомендую посмотреть эту главу. Там и про векторное пространство, и про расстояния очень доходчиво с картинками.
👍10🔥2
DH-центр ИТМО в Лектории Брусницына

Раз в две недели по субботам будем собираться в Лектории Брусницына и говорить с экспертами DH-центра про исследования в области цифровой гуманитаристики. Что это такое и кто этим занимается?

DH-центр — центр цифровых гуманитарных
исследований университета ИТМО, который организует магистратуру в Санкт-Петербурге, курирует цифровые проекты с культурными институциями и проводит исследования.

В Лектории будут выступать преподаватели магистратуры и команда центра. На лекциях вы узнаете о том, как цифровые методы и инструменты существуют в мире гуманитарных исследований.

Программа:

19 октября
«Как оцифровать болезнь? Цифровая гуманитаристика в медицине»

2 ноября
«GLAMVR: галереи, архивы, музеи, библиотеки и их цифровая жизнь»

16 ноября
«Игра как совместное событие в физическом и цифровом пространстве»

30 ноября
«Интерфейсы цифровых архивов: аутентичность, пользователи и правила»

14 и 28 декабря
темы уточняются (следите за анонсами)

Первая лекция «Как оцифровать болезнь? Цифровая гуманитаристика в медицине» пройдет 19 октября.

Поговорим о том, как технологии стали неотъемлемой частью медицинских процессов и как соотносятся версии болезни в «реальном» и «виртуальном» измерениях?

Спикер — Илья Смирнов, преподаватель программы магистратуры по Digital Humanities ИТМО, социальный исследователь науки и технологий (STS), аспирант ЕУ СПб, основатель проекта Versia.

Вход свободный, необходма регистрация

🗓 19 октября, 15:00
📍Культурный квартал Брусницын, Лекторий (Дом с колоннами, 3 этаж, вход в арке)
8👍2🔥2
2025/07/14 02:42:53
Back to Top
HTML Embed Code: