HQHSE Telegram 475
«Вероятно, да»: неопределенность в русскоязычных статьях

Задумывались ли вы о когда-нибудь о том, есть ли баланс в отношении использования выражений неопределенности в академическом письме? «Возможно», «вероятно», «гипотетически» — такие слова, с одной стороны, могут свидетельствовать об осторожности и педантичности ученого, пишущего статью, но с другой — демонстрировать (или казаться) признаком неуверенности. Стремясь избежать последнего, в ряде случаев исследователи могут намеренно или неосознанно начать использовать более «позитивный» язык, в котором меньше места отводится выражению сомнений, что, безусловно, влияет на восприятие исследовательских выводов.

В прошлом году китайские ученые провели масштабный анализ текстов статей в журнале "Science" за 1997-2021 гг., чтобы определить частоту использования выражений неопределенности (которые исследователи довольно метко назвали «хедж-словами») и возможные закономерности их изменения. Корпус состоял из 2600 статей, содержащих в общей сложности более 11 млн слов. Авторы провели детальный статистический анализ, в том числе по отдельными частям речи, и выяснили, что за 25 лет частота использования хедж-слов упала более чем на 40% — с 115.8 до 67.42 на 10 тысяч слов.

Мы решили проверить, подтверждаются ли эти наблюдения для работ на русском языке на основе данных OpenAlex c 2001 по 2024 г. и составили список слов, выражающих неопределенность, включая наречия, прилагательные, местоимения и частицы. При этом мы рассчитали отношение количества публикаций, содержащих каждое из хедж-слов, к общему числу публикаций на русском языке, так как полные тексты анализировались через n-граммы. Поскольку в OpenAlex реализована возможность полнотекстового поиска, мы ввели в качестве фильтра API-запроса наличие полнотекстовой версии (всего таких работ 241 615 из 2 138 926 за указанный период времени). Ограничением API OpenAlex и нашего анализа стала невозможность использования метасимволов (wildcards) в поиске, поэтому все леммы прописывались вручную.

Сгруппировав информацию о доле статей, содержащих хедж-слова, по годам и по укрупненным научным областям, мы получили график, приведенный по ссылке и на диаграмме, приложенной к посту. При таком методе анализа для русскоязычного сегмента, выводы китайских ученых подтверждаются лишь частично. В медицине и науках о жизни процентное соотношение хедж-слов стабильно низкое — не более 10 % за весь рассматриваемый период с незначительными колебаниями.

Для физических наук наблюдается резкий рост доли хедж-слов с 2005 по 2006 г., далее рост замедляется, а после 2008 года начинается постепенное неравномерное снижение, с локальными максимумами в 2012 и 2015 гг. В социальных науках постепенный рост использования выражений неопределенности начинается с 2013 года, в 2019-2020 показатель выходит на плато, а затем снижается, причем довольно стремительно.

Не вполне очевидно (присоединяемся к неуверенной когорте), говорит ли это о том, что российские ученые выбирают более аккуратные выражения, даже если текст выглядит от этого менее точным, или результаты продиктованы особенностями академического письма на русском языке.

В случае такого авторитетного журнала, как Science, использование хедж-слов может быть неявной стратегией продвижения своего исследования одновременно со снижением риска встретиться с критикой, спорами и сомнениями. Вместе с тем природа академического знания зачастую действительно неопределенна, поэтому поиск баланса (особенно в отдельных дисциплинах) продолжает оставаться нетривиальной задачей.

#аналитика #неопределенность #OpenAlex



tgoop.com/HQhse/475
Create:
Last Update:

«Вероятно, да»: неопределенность в русскоязычных статьях

Задумывались ли вы о когда-нибудь о том, есть ли баланс в отношении использования выражений неопределенности в академическом письме? «Возможно», «вероятно», «гипотетически» — такие слова, с одной стороны, могут свидетельствовать об осторожности и педантичности ученого, пишущего статью, но с другой — демонстрировать (или казаться) признаком неуверенности. Стремясь избежать последнего, в ряде случаев исследователи могут намеренно или неосознанно начать использовать более «позитивный» язык, в котором меньше места отводится выражению сомнений, что, безусловно, влияет на восприятие исследовательских выводов.

В прошлом году китайские ученые провели масштабный анализ текстов статей в журнале "Science" за 1997-2021 гг., чтобы определить частоту использования выражений неопределенности (которые исследователи довольно метко назвали «хедж-словами») и возможные закономерности их изменения. Корпус состоял из 2600 статей, содержащих в общей сложности более 11 млн слов. Авторы провели детальный статистический анализ, в том числе по отдельными частям речи, и выяснили, что за 25 лет частота использования хедж-слов упала более чем на 40% — с 115.8 до 67.42 на 10 тысяч слов.

Мы решили проверить, подтверждаются ли эти наблюдения для работ на русском языке на основе данных OpenAlex c 2001 по 2024 г. и составили список слов, выражающих неопределенность, включая наречия, прилагательные, местоимения и частицы. При этом мы рассчитали отношение количества публикаций, содержащих каждое из хедж-слов, к общему числу публикаций на русском языке, так как полные тексты анализировались через n-граммы. Поскольку в OpenAlex реализована возможность полнотекстового поиска, мы ввели в качестве фильтра API-запроса наличие полнотекстовой версии (всего таких работ 241 615 из 2 138 926 за указанный период времени). Ограничением API OpenAlex и нашего анализа стала невозможность использования метасимволов (wildcards) в поиске, поэтому все леммы прописывались вручную.

Сгруппировав информацию о доле статей, содержащих хедж-слова, по годам и по укрупненным научным областям, мы получили график, приведенный по ссылке и на диаграмме, приложенной к посту. При таком методе анализа для русскоязычного сегмента, выводы китайских ученых подтверждаются лишь частично. В медицине и науках о жизни процентное соотношение хедж-слов стабильно низкое — не более 10 % за весь рассматриваемый период с незначительными колебаниями.

Для физических наук наблюдается резкий рост доли хедж-слов с 2005 по 2006 г., далее рост замедляется, а после 2008 года начинается постепенное неравномерное снижение, с локальными максимумами в 2012 и 2015 гг. В социальных науках постепенный рост использования выражений неопределенности начинается с 2013 года, в 2019-2020 показатель выходит на плато, а затем снижается, причем довольно стремительно.

Не вполне очевидно (присоединяемся к неуверенной когорте), говорит ли это о том, что российские ученые выбирают более аккуратные выражения, даже если текст выглядит от этого менее точным, или результаты продиктованы особенностями академического письма на русском языке.

В случае такого авторитетного журнала, как Science, использование хедж-слов может быть неявной стратегией продвижения своего исследования одновременно со снижением риска встретиться с критикой, спорами и сомнениями. Вместе с тем природа академического знания зачастую действительно неопределенна, поэтому поиск баланса (особенно в отдельных дисциплинах) продолжает оставаться нетривиальной задачей.

#аналитика #неопределенность #OpenAlex

BY Выше квартилей




Share with your friend now:
tgoop.com/HQhse/475

View MORE
Open in Telegram


Telegram News

Date: |

best-secure-messaging-apps-shutterstock-1892950018.jpg For crypto enthusiasts, there was the “gm” app, a self-described “meme app” which only allowed users to greet each other with “gm,” or “good morning,” a common acronym thrown around on Crypto Twitter and Discord. But the gm app was shut down back in September after a hacker reportedly gained access to user data. Matt Hussey, editorial director of NEAR Protocol (and former editor-in-chief of Decrypt) responded to the news of the Telegram group with “#meIRL.” In 2018, Telegram’s audience reached 200 million people, with 500,000 new users joining the messenger every day. It was launched for iOS on 14 August 2013 and Android on 20 October 2013. It’s yet another bloodbath on Satoshi Street. As of press time, Bitcoin (BTC) and the broader cryptocurrency market have corrected another 10 percent amid a massive sell-off. Ethereum (EHT) is down a staggering 15 percent moving close to $1,000, down more than 42 percent on the weekly chart.
from us


Telegram Выше квартилей
FROM American