tgoop.com/dataset_ru/11
Last Update:
Текстовые данные
Датасет с анекдотами
www.tgoop.com/NeuralShit/2321
Датасет с анекдотами
github.com/e1four15f/TFS19s-NLP-Jokes/blob/master/experiment_1/jokes.csv
Датасет с цитатами
www.tgoop.com/NeuralShit/2202
Корпус лемматизированных (морфологически нормализованных) текстов российских СМИ
github.com/maxoodf/russian_news_corpus
Сборник новостей gazeta.ru
kaggle.com/phoenix120/gazeta-summaries
Сборник новостей "Россия сегодня"
https://github.com/RossiyaSegodnya/ria_news_dataset
Корпус новостей с Lenta.Ru
github.com/yutkin/Lenta.Ru-News-Datase
Русскоязычный корпус коротких текстов RuTweetCorp состоящий из 17,639,674 записей
study.mokoron.com/#corpora
RuAdapt: параллельный датасет упрощенного русского языка
github.com/Digital-Pushkin-Lab/RuAdapt
Фамилии
www.tgoop.com/dataset_chat/40
Репозиторий включает в себя Датасет гороскопов с сайта https://horoscopes.rambler.ru
https://github.com/ArmageddonReloadedDK/astro
Русскоязычные NLP датасеты
github.com/Koziev/NLP_Datasets
Набор данных содержит более 40 тысяч игр из магазина Steam с подробными данными.
https://www.kaggle.com/trolukovich/steam-games-complete-dataset
Набор данных из популярного российского коллективного блога Habrahabr
https://github.com/romovpa/habrahabr-dataset
Набор данных с 10 тыс. Решений хозяйственных судов РФ и анализом ggplot2 / dplyr.
https://github.com/alexeyknorre/Rbitrazh
Данные по законопроектам Государственной Думы.
https://github.com/infoculture/lawmon
Датасет русских поэм
https://github.com/Laefye/RussionDatasetPoems
Русские романы
https://github.com/JoannaBy/RussianNovels
Мемы с текстовыми описаниями
https://www.tgoop.com/lovedeathtransformers/4792
@dataset_ru
BY RU Dataset | Датасеты
Share with your friend now:
tgoop.com/dataset_ru/11