tgoop.com/archaeowalking/45
Last Update:
С небольшим запозданием, но и я прочитал отличную статью Д. Скоринкина в "Системном блоке" про крушение лингвистического направления в компании Abbyy. Сразу возникло множество параллелей, которые можно свести примерно к такому общему выводу: древовидность - отнюдь не самый лучший способ связывания данных. Автор статьи описывает проигрыш системы представления языка как древовидного набора правил и понятий, а я сразу представляю более знакомые мне образцы таких наборов - и тупики в них, как мне кажется, тоже связаны с неестественным ограничением древовидности. Например, археологические культуры. Вот, например, у нас есть эпоха бронзы, внутри бронзы ямная культурно-историческая общность, внутри общности культуры, внутри культур группы, внутри групп варианты... Когда Стас Васильев из СПб делал программку для учёта археологических памятников, у него там прям было дерево культур для выбора, и сразу было видно, насколько это мертворожденная идея (а там не только культуры были в дереве, а вообще всё, что поддавалось логическому таксономированию - как будто само слово "классификация" этого требовало).
Скоринкин говорит о частном случае и победитель в частном случае - статистический метод, то есть, по сути, "прецедентное право", набор удавшихся экспериментов и использование статистически лучших из них. Я подозреваю, что дело тут не в статистике (то есть как бы в случайности, точнее, непредсказуемости экспериментов), а в том, что именно такая организация любого знания (не только языка!) органична и естественна. Археологические памятники тоже близки друг к другу не иерархически; мы можем и для них вычислять что-то вроде косинусной близости, хотя это будет не причина их родства, а признак наличия каких-то более глубоких и сложных причин.
По работе я некоторое время назад немного столкнулся с принципами формирования УДК, такой книжной тематической классификации - она тоже древовидная и тоже нифига не работает и непонятно, зачем в наше время может быть нужна. Формальная моя начальница полжизни убила на борьбу с УДК/ББК и их замену на... другую древовидную классификацию, хоть и на чуть более продвинутых началах.
А в бёрдвотчерском чате в последние дни (и не только) обсуждаются изменения в систематике птиц, когда на основании генетических исследований одни виды "перелетают" чуть ли не из отряда в отряд, а другие виды оказываются вовсе не видами, а просто жалкими локальными вариациями. То есть ко всем чертям летит самая, наверное, общеизвестная древовидная классификация ever, систематика живых существ! Специалисты, кстати, давно в курсе, что там не всё так однозначно.
Вот такие пироги! Двести лет назад древовидная организация знания была революционным прорывом, а теперь на наших глазах её заменяет... что её заменяет? многомерная матрица? связный граф?
https://sysblok.ru/blog/gorkij-urok-abbyy-kak-lingvisty-proigrali-poslednjuju-bitvu-za-nlp/
BY Прогулки по археологии (канал)

Share with your friend now:
tgoop.com/archaeowalking/45