tgoop.com/lingulinks/689
Last Update:
Рекламная пауза (невсамделишная, по делу)
Вдобавок к уже давно работающему WALS (Всемирный атлас языковых структур) недавно открылось ещё две полезные бесплатные базы с открытыми данными: Грамбанк и Кинбанк.
Сам WALS содержит не только базу данных, позволяющую группировать языки по одному из 192 параметров, например, количеству согласных фонем или числу падежей, но и 152 статьи, описывающие многие параметры и дающие примеры (вот например про число падежей). Для всех параметров можно увидеть соответствующие данные на карте: https://i.imgur.com/sWrwz88.png здесь заметно, что в языках Кавказа обычно много согласных, а в языках Индонезии — наоборот.
В базе WALS всего 2662 языка (в широком смысле, идиома), но не по всем из них есть полные данные, скажем, сведения по размеру инвентаря согласных имеются для 563 языков.
WALS доступен по лицензии CC-BY, можно делать с текстами и данными оттуда что угодно при условии указания авторства.
Так вот, Грамбанк содержит 2467 языка из 215 разных семей и 101 изолят. Он организован очень похоже на WALS, там 195 параметров, но они не совпадают: в WALS есть две статьи про артикли: про определённые и неопределённые , тогда как в Грамбанке их 16, включая «Согласование артикля в числе с существительным». Также в Грамбанке для большинства параметров есть данные для как минимум тысячи языков, тогда как WALS нередко ограничивается парой сотен.
Тоже доступен по CC-BY.
1/2
BY Lingulinks

Share with your friend now:
tgoop.com/lingulinks/689