DATASET_RU Telegram 22
Лингвистические датасеты

Тональный словарь русского языка КартаСловСент — слова и выражения русского языка, снабжённые тональной меткой («положительное», «отрицательное», «нейтральное») и скалярным значением силы эмоционально-оценочного заряда из непрерывного диапазона [-1, 1].

Открытая семантика русского языка — разметка слов и выражений русского языка по семантическим срезам («люди», «животные», «сооружения», «вещи», «действия» и т.д.).

Ассоциации к словам и выражениям русского языка — ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.

Орфографические ошибки и опечатки — слова русского языка и варианты их неправильного написания. Включает в себя как орфографические ошибки, так и опечатки. Все ошибочные написания снабжены весами, позволяющими оценить относительную частоту встречаемости тех или иных ошибок.

Датасет состоящий из русских предложений.

Event2Mind для русского языка
Данные: github.com/Alenush/russian_event2mind

Отслеживание семантических сдвигов для русского языка
Прилагательные вручную аннотированные для временных семантических сдвигов в промежутке времени от 2000 до 2014 года.

RULEC-GEC - это набор предложений, написанных изучающими русский язык и помеченных на ошибки.

Определение композиционности существительных с использованием распределительной семантики для русского языка

Математический набор данных переведен на русский язык

The Knowledge Base Question Answering

Рукописные символы русских берестяных грамот

Открытая семантика русского языка

Национальный корпус русского языка


@dataset_ru



tgoop.com/dataset_ru/22
Create:
Last Update:

Лингвистические датасеты

Тональный словарь русского языка КартаСловСент — слова и выражения русского языка, снабжённые тональной меткой («положительное», «отрицательное», «нейтральное») и скалярным значением силы эмоционально-оценочного заряда из непрерывного диапазона [-1, 1].

Открытая семантика русского языка — разметка слов и выражений русского языка по семантическим срезам («люди», «животные», «сооружения», «вещи», «действия» и т.д.).

Ассоциации к словам и выражениям русского языка — ассоциации к словам и выражениям русского языка, придуманные реальными людьми. Кроме общего набора публикуются данные срезов по гендеру, т.е. включающие частоты ассоциаций, подсчитанные отдельно для мужчин и для женщин.

Орфографические ошибки и опечатки — слова русского языка и варианты их неправильного написания. Включает в себя как орфографические ошибки, так и опечатки. Все ошибочные написания снабжены весами, позволяющими оценить относительную частоту встречаемости тех или иных ошибок.

Датасет состоящий из русских предложений.

Event2Mind для русского языка
Данные: github.com/Alenush/russian_event2mind

Отслеживание семантических сдвигов для русского языка
Прилагательные вручную аннотированные для временных семантических сдвигов в промежутке времени от 2000 до 2014 года.

RULEC-GEC - это набор предложений, написанных изучающими русский язык и помеченных на ошибки.

Определение композиционности существительных с использованием распределительной семантики для русского языка

Математический набор данных переведен на русский язык

The Knowledge Base Question Answering

Рукописные символы русских берестяных грамот

Открытая семантика русского языка

Национальный корпус русского языка


@dataset_ru

BY RU Dataset | Датасеты


Share with your friend now:
tgoop.com/dataset_ru/22

View MORE
Open in Telegram


Telegram News

Date: |

Deputy District Judge Peter Hui sentenced computer technician Ng Man-ho on Thursday, a month after the 27-year-old, who ran a Telegram group called SUCK Channel, was found guilty of seven charges of conspiring to incite others to commit illegal acts during the 2019 extradition bill protests and subsequent months. As five out of seven counts were serious, Hui sentenced Ng to six years and six months in jail. Joined by Telegram's representative in Brazil, Alan Campos, Perekopsky noted the platform was unable to cater to some of the TSE requests due to the company's operational setup. But Perekopsky added that these requests could be studied for future implementation. Don’t publish new content at nighttime. Since not all users disable notifications for the night, you risk inadvertently disturbing them. In the “Bear Market Screaming Therapy Group” on Telegram, members are only allowed to post voice notes of themselves screaming. Anything else will result in an instant ban from the group, which currently has about 75 members.
from us


Telegram RU Dataset | Датасеты
FROM American