GULAGDIGITAL Telegram 2920
Нобелевская премия, институты и LLM

Не самый большой знаток работ Аджемоглу и, признаюсь, читать его книги "Почему богатые страны"(имейте институты и имейте их сто лет назад, желающие могут почитать Ватоадмина/Василия Тополева) было непросто. Но поговорим лучше о старой Нобелевке, писал о ней год назад.

"Грамматика институтов" — подход, предложенный Сью Кроуфорд и Элионор Остром в 1995 году. Он фокусируется на синтаксических структурных элементах, которые составляют и формируют институции. В 2009 году Элинор Остром получила премию памяти А. Нобеля по экономике за анализ феномена "economic governance" (термина, которому сложно подобрать точное русскоязычное обозначение).

Ссылка: https://www.tgoop.com/evidence_guide/9

Широкое распространение подхода "грамматики институтов" затрудняют высокие временные и ресурсные затраты. В статье предлагается использовать машинное обучение и анализировать тексты с помощью методов NLP (обработка естественного языка). В качестве примера используется анализ 19 документов, регламентирующих работу пищевой отрасли.

Rice, Douglas, et al. "Machine Coding of Policy Texts with the Institutional Grammar." Public Administration. December 2020.
Ссылка: https://onlinelibrary.wiley.com/doi/10.1111/padm.12711

Этапы анализа:

1. Текст обрабатывается и размечается с помощью методов NLP для учета нестандартного форматирования: специфической пунктуации (тире, "буллеты" и т.п.) и сложной структуры текста. Для этого используется пакет Stanford CoreNLP на языке R.

2. Далее текст размечается по правилам "грамматики институтов" с помощью машинного обучения с учителем. Выделяются следующие 6 синтаксических элементов:

- Атрибут (Attribute, [A]) – актор, к которому относится утверждение.
- Цель (Aim, [I]) – действие утверждения.
- Деонтика (Deontic, [D]) – предписание, что актор должен или не должен делать.
- Объект (Object, [B]) – объект, к которому относится действие.
- Условие (Condition, [C]) – временные, пространственные или регуляторные ограничения.
- Or else (O) – стимул для выполнения или невыполнения действия (например, наказание за нарушение).

Эти элементы объединяются в набор, обозначаемый как ABDICO.

Пример:
Предложение: "Операции, сертифицированные как органические в соответствии с Национальной программой США по органическому производству, должны ежегодно представлять план органической системы, в противном случае сертификация будет отменена."

Разметка:
- Атрибут: "Операции, сертифицированные как органические..."
- Деонтика: "должны"
- Цель: "представлять"
- Объект: "план органической системы"
- Условие: "ежегодно"
- Or else: "в противном случае сертификация будет отменена"

В статье использовался набор из 19 документов, регламентирующих работу пищевой отрасли. Все слова, размеченные вручную как элементы "грамматики институтов", были разделены на обучающее множество (8320 слов) и множество для оценки (922 слова). Разметка текстов в соответствии с правилами "грамматики институтов" производилась с использованием машинного обучения с учителем, в частности нейронных сетей.

"Грамматика институтов", предложенная более двух десятилетий назад, открывает перспективы для ученых, занимающихся государственной политикой и администрированием, заинтересованных в систематическом изучении структуры и понимания политических текстов. Полученный уровень точности автоматической классификации подтверждает полезность такого анализа текстов в рамках подхода "грамматики институтов". Увеличение точности возможно при расширении количества классифицированных текстов, совершенствовании методов обработки естественного языка и машинного обучения.

Теперь ждём применения методов грамматики институтов на дешёвом LLM и ChatGPT.



tgoop.com/gulagdigital/2920
Create:
Last Update:

Нобелевская премия, институты и LLM

Не самый большой знаток работ Аджемоглу и, признаюсь, читать его книги "Почему богатые страны"(имейте институты и имейте их сто лет назад, желающие могут почитать Ватоадмина/Василия Тополева) было непросто. Но поговорим лучше о старой Нобелевке, писал о ней год назад.

"Грамматика институтов" — подход, предложенный Сью Кроуфорд и Элионор Остром в 1995 году. Он фокусируется на синтаксических структурных элементах, которые составляют и формируют институции. В 2009 году Элинор Остром получила премию памяти А. Нобеля по экономике за анализ феномена "economic governance" (термина, которому сложно подобрать точное русскоязычное обозначение).

Ссылка: https://www.tgoop.com/evidence_guide/9

Широкое распространение подхода "грамматики институтов" затрудняют высокие временные и ресурсные затраты. В статье предлагается использовать машинное обучение и анализировать тексты с помощью методов NLP (обработка естественного языка). В качестве примера используется анализ 19 документов, регламентирующих работу пищевой отрасли.

Rice, Douglas, et al. "Machine Coding of Policy Texts with the Institutional Grammar." Public Administration. December 2020.
Ссылка: https://onlinelibrary.wiley.com/doi/10.1111/padm.12711

Этапы анализа:

1. Текст обрабатывается и размечается с помощью методов NLP для учета нестандартного форматирования: специфической пунктуации (тире, "буллеты" и т.п.) и сложной структуры текста. Для этого используется пакет Stanford CoreNLP на языке R.

2. Далее текст размечается по правилам "грамматики институтов" с помощью машинного обучения с учителем. Выделяются следующие 6 синтаксических элементов:

- Атрибут (Attribute, [A]) – актор, к которому относится утверждение.
- Цель (Aim, [I]) – действие утверждения.
- Деонтика (Deontic, [D]) – предписание, что актор должен или не должен делать.
- Объект (Object, [B]) – объект, к которому относится действие.
- Условие (Condition, [C]) – временные, пространственные или регуляторные ограничения.
- Or else (O) – стимул для выполнения или невыполнения действия (например, наказание за нарушение).

Эти элементы объединяются в набор, обозначаемый как ABDICO.

Пример:
Предложение: "Операции, сертифицированные как органические в соответствии с Национальной программой США по органическому производству, должны ежегодно представлять план органической системы, в противном случае сертификация будет отменена."

Разметка:
- Атрибут: "Операции, сертифицированные как органические..."
- Деонтика: "должны"
- Цель: "представлять"
- Объект: "план органической системы"
- Условие: "ежегодно"
- Or else: "в противном случае сертификация будет отменена"

В статье использовался набор из 19 документов, регламентирующих работу пищевой отрасли. Все слова, размеченные вручную как элементы "грамматики институтов", были разделены на обучающее множество (8320 слов) и множество для оценки (922 слова). Разметка текстов в соответствии с правилами "грамматики институтов" производилась с использованием машинного обучения с учителем, в частности нейронных сетей.

"Грамматика институтов", предложенная более двух десятилетий назад, открывает перспективы для ученых, занимающихся государственной политикой и администрированием, заинтересованных в систематическом изучении структуры и понимания политических текстов. Полученный уровень точности автоматической классификации подтверждает полезность такого анализа текстов в рамках подхода "грамматики институтов". Увеличение точности возможно при расширении количества классифицированных текстов, совершенствовании методов обработки естественного языка и машинного обучения.

Теперь ждём применения методов грамматики институтов на дешёвом LLM и ChatGPT.

BY Цифровой геноцид


Share with your friend now:
tgoop.com/gulagdigital/2920

View MORE
Open in Telegram


Telegram News

Date: |

The channel also called on people to turn out for illegal assemblies and listed the things that participants should bring along with them, showing prior planning was in the works for riots. The messages also incited people to hurl toxic gas bombs at police and MTR stations, he added. Private channels are only accessible to subscribers and don’t appear in public searches. To join a private channel, you need to receive a link from the owner (administrator). A private channel is an excellent solution for companies and teams. You can also use this type of channel to write down personal notes, reflections, etc. By the way, you can make your private channel public at any moment. With Bitcoin down 30% in the past week, some crypto traders have taken to Telegram to “voice” their feelings. The court said the defendant had also incited people to commit public nuisance, with messages calling on them to take part in rallies and demonstrations including at Hong Kong International Airport, to block roads and to paralyse the public transportation system. Various forms of protest promoted on the messaging platform included general strikes, lunchtime protests and silent sit-ins. How to create a business channel on Telegram? (Tutorial)
from us


Telegram Цифровой геноцид
FROM American