ARCHAEOWALKING Telegram 45
С небольшим запозданием, но и я прочитал отличную статью Д. Скоринкина в "Системном блоке" про крушение лингвистического направления в компании Abbyy. Сразу возникло множество параллелей, которые можно свести примерно к такому общему выводу: древовидность - отнюдь не самый лучший способ связывания данных. Автор статьи описывает проигрыш системы представления языка как древовидного набора правил и понятий, а я сразу представляю более знакомые мне образцы таких наборов - и тупики в них, как мне кажется, тоже связаны с неестественным ограничением древовидности. Например, археологические культуры. Вот, например, у нас есть эпоха бронзы, внутри бронзы ямная культурно-историческая общность, внутри общности культуры, внутри культур группы, внутри групп варианты... Когда Стас Васильев из СПб делал программку для учёта археологических памятников, у него там прям было дерево культур для выбора, и сразу было видно, насколько это мертворожденная идея (а там не только культуры были в дереве, а вообще всё, что поддавалось логическому таксономированию - как будто само слово "классификация" этого требовало).
Скоринкин говорит о частном случае и победитель в частном случае - статистический метод, то есть, по сути, "прецедентное право", набор удавшихся экспериментов и использование статистически лучших из них. Я подозреваю, что дело тут не в статистике (то есть как бы в случайности, точнее, непредсказуемости экспериментов), а в том, что именно такая организация любого знания (не только языка!) органична и естественна. Археологические памятники тоже близки друг к другу не иерархически; мы можем и для них вычислять что-то вроде косинусной близости, хотя это будет не причина их родства, а признак наличия каких-то более глубоких и сложных причин.
По работе я некоторое время назад немного столкнулся с принципами формирования УДК, такой книжной тематической классификации - она тоже древовидная и тоже нифига не работает и непонятно, зачем в наше время может быть нужна. Формальная моя начальница полжизни убила на борьбу с УДК/ББК и их замену на... другую древовидную классификацию, хоть и на чуть более продвинутых началах.
А в бёрдвотчерском чате в последние дни (и не только) обсуждаются изменения в систематике птиц, когда на основании генетических исследований одни виды "перелетают" чуть ли не из отряда в отряд, а другие виды оказываются вовсе не видами, а просто жалкими локальными вариациями. То есть ко всем чертям летит самая, наверное, общеизвестная древовидная классификация ever, систематика живых существ! Специалисты, кстати, давно в курсе, что там не всё так однозначно.
Вот такие пироги! Двести лет назад древовидная организация знания была революционным прорывом, а теперь на наших глазах её заменяет... что её заменяет? многомерная матрица? связный граф?
https://sysblok.ru/blog/gorkij-urok-abbyy-kak-lingvisty-proigrali-poslednjuju-bitvu-za-nlp/



tgoop.com/archaeowalking/45
Create:
Last Update:

С небольшим запозданием, но и я прочитал отличную статью Д. Скоринкина в "Системном блоке" про крушение лингвистического направления в компании Abbyy. Сразу возникло множество параллелей, которые можно свести примерно к такому общему выводу: древовидность - отнюдь не самый лучший способ связывания данных. Автор статьи описывает проигрыш системы представления языка как древовидного набора правил и понятий, а я сразу представляю более знакомые мне образцы таких наборов - и тупики в них, как мне кажется, тоже связаны с неестественным ограничением древовидности. Например, археологические культуры. Вот, например, у нас есть эпоха бронзы, внутри бронзы ямная культурно-историческая общность, внутри общности культуры, внутри культур группы, внутри групп варианты... Когда Стас Васильев из СПб делал программку для учёта археологических памятников, у него там прям было дерево культур для выбора, и сразу было видно, насколько это мертворожденная идея (а там не только культуры были в дереве, а вообще всё, что поддавалось логическому таксономированию - как будто само слово "классификация" этого требовало).
Скоринкин говорит о частном случае и победитель в частном случае - статистический метод, то есть, по сути, "прецедентное право", набор удавшихся экспериментов и использование статистически лучших из них. Я подозреваю, что дело тут не в статистике (то есть как бы в случайности, точнее, непредсказуемости экспериментов), а в том, что именно такая организация любого знания (не только языка!) органична и естественна. Археологические памятники тоже близки друг к другу не иерархически; мы можем и для них вычислять что-то вроде косинусной близости, хотя это будет не причина их родства, а признак наличия каких-то более глубоких и сложных причин.
По работе я некоторое время назад немного столкнулся с принципами формирования УДК, такой книжной тематической классификации - она тоже древовидная и тоже нифига не работает и непонятно, зачем в наше время может быть нужна. Формальная моя начальница полжизни убила на борьбу с УДК/ББК и их замену на... другую древовидную классификацию, хоть и на чуть более продвинутых началах.
А в бёрдвотчерском чате в последние дни (и не только) обсуждаются изменения в систематике птиц, когда на основании генетических исследований одни виды "перелетают" чуть ли не из отряда в отряд, а другие виды оказываются вовсе не видами, а просто жалкими локальными вариациями. То есть ко всем чертям летит самая, наверное, общеизвестная древовидная классификация ever, систематика живых существ! Специалисты, кстати, давно в курсе, что там не всё так однозначно.
Вот такие пироги! Двести лет назад древовидная организация знания была революционным прорывом, а теперь на наших глазах её заменяет... что её заменяет? многомерная матрица? связный граф?
https://sysblok.ru/blog/gorkij-urok-abbyy-kak-lingvisty-proigrali-poslednjuju-bitvu-za-nlp/

BY Прогулки по археологии (канал)




Share with your friend now:
tgoop.com/archaeowalking/45

View MORE
Open in Telegram


Telegram News

Date: |

Activate up to 20 bots Joined by Telegram's representative in Brazil, Alan Campos, Perekopsky noted the platform was unable to cater to some of the TSE requests due to the company's operational setup. But Perekopsky added that these requests could be studied for future implementation. ‘Ban’ on Telegram 4How to customize a Telegram channel? Telegram channels enable users to broadcast messages to multiple users simultaneously. Like on social media, users need to subscribe to your channel to get access to your content published by one or more administrators.
from us


Telegram Прогулки по археологии (канал)
FROM American