К этому прекрасному мему добавим, что в английские словари добавляют — но не фото, а рисунки. Или уже и фото бывают? А вот видео Мерриам-Уэбстера про эти рисунки.
Попробовал погенерировать логотипы для этого канала с помощью ChatGPT, который теперь умеет писать на картинках осмысленный текст. Пока что наблюдаем лёгкую дисграфию, так что менять ничего не буду, остаюсь с той же сингальской буквой.
Иностранцы переосмысляют Берлин
1. (Рассказала Мария Львовна Рубинштейн) «В середине 90-х (т. е. мобильных телефонов еще не было) мой папа кому-то русскоязычному назначил встречу в Берлине на станции Möckernbrücke и сказал: не забудьте название станции — похоже на „Мокрые брюки“. А тот человек не приехал и потом оправдывался, что искал на карте что-то похожее на „Мокрые штаны“, но не нашёл».
2. (Рассказал Карлуш Тейшейра, германист из Порту) Бразильский поэт Рафаэл Мантовани написал стихотворение «Berlã». Как видно, слово Берлин в названии произнесено с нарочитой португализацией, с носовым гласным ã (хотя вообще-то по-португальски говорят Berlim). А начинается стихотворение так:
alguma coisa acontece no meu coração
que saio à procura de amor em kottbussetão
что-то происходит в моём сердце
и я выхожу на поиски любви на kottbussetão
kottbussetão — это станция метро Kottbusser Tor, опять-таки нарочито португализированная. Услышав этот пример в докладе, я очень обрадовался, но окружающая публика явно обрадовалась ещё больше. За обедом докладчик мне всё объяснил: оказывается, buceta/boceta по-португальски — это женский половой орган, а -bussetão, соответственно, он же, но большой.
Кстати, от Мокрых Штанов до Большой … всего три станции метро по прямой.
P.S. А вообще первая строчка — alguma coisa acontece no meu coração — взята из известной песни про Сан-Паулу; там рифма с avenida São João.
1. (Рассказала Мария Львовна Рубинштейн) «В середине 90-х (т. е. мобильных телефонов еще не было) мой папа кому-то русскоязычному назначил встречу в Берлине на станции Möckernbrücke и сказал: не забудьте название станции — похоже на „Мокрые брюки“. А тот человек не приехал и потом оправдывался, что искал на карте что-то похожее на „Мокрые штаны“, но не нашёл».
2. (Рассказал Карлуш Тейшейра, германист из Порту) Бразильский поэт Рафаэл Мантовани написал стихотворение «Berlã». Как видно, слово Берлин в названии произнесено с нарочитой португализацией, с носовым гласным ã (хотя вообще-то по-португальски говорят Berlim). А начинается стихотворение так:
alguma coisa acontece no meu coração
que saio à procura de amor em kottbussetão
что-то происходит в моём сердце
и я выхожу на поиски любви на kottbussetão
kottbussetão — это станция метро Kottbusser Tor, опять-таки нарочито португализированная. Услышав этот пример в докладе, я очень обрадовался, но окружающая публика явно обрадовалась ещё больше. За обедом докладчик мне всё объяснил: оказывается, buceta/boceta по-португальски — это женский половой орган, а -bussetão, соответственно, он же, но большой.
Кстати, от Мокрых Штанов до Большой … всего три станции метро по прямой.
P.S. А вообще первая строчка — alguma coisa acontece no meu coração — взята из известной песни про Сан-Паулу; там рифма с avenida São João.
Я думаю, чтобы Саша, самое главное, играл, а рекорды, шайбы, они будут, если он будет играть и не думать об этом, — говорит Татьяна Овечкина.
Семантический переход «спортивный снаряд —> попадание этим снарядом в требуемое для изменения счёта пространство (гол)» у русских слов мяч и шайба наблюдается регулярно:
В матча 23-го тура РПЛ против «Ростова» Умяров отметился забитым мячом. (ссылка)
Уже через три минуты после исторического гола Овечкина «Айлендерс» восстановили преимущество в две шайбы. (ссылка)
А в других языках гораздо распространённее переход «цель —> требуемое для изменения счёта пространство (ворота) —> попадание в требуемое для изменения счёта пространство (гол)»: английское goal, французское but, шведское mål ‘цель’, ‘ворота’ и ‘гол’. Есть языки, где действует только вторая стрелочка: немецкое Tor, чешское branka, польское bramka ‘ворота’ и ‘гол’. Так же устроены и языки, которые заимствовали английское goal во втором и в третьем значении: фарси gol, сербское гол.
Но всё-таки, возвращаясь к словам мяч и шайба в значении ‘гол’ — неужели русский язык один такой? Ovechkin's pucks(и уже тем более Messi's balls) по-английски в этом смысле явно сказать нельзя. А вдруг в каком-то языке можно? Я ни одного такого языка не знаю — найдём ли мы что-нибудь общими усилиями?
Семантический переход «спортивный снаряд —> попадание этим снарядом в требуемое для изменения счёта пространство (гол)» у русских слов мяч и шайба наблюдается регулярно:
В матча 23-го тура РПЛ против «Ростова» Умяров отметился забитым мячом. (ссылка)
Уже через три минуты после исторического гола Овечкина «Айлендерс» восстановили преимущество в две шайбы. (ссылка)
А в других языках гораздо распространённее переход «цель —> требуемое для изменения счёта пространство (ворота) —> попадание в требуемое для изменения счёта пространство (гол)»: английское goal, французское but, шведское mål ‘цель’, ‘ворота’ и ‘гол’. Есть языки, где действует только вторая стрелочка: немецкое Tor, чешское branka, польское bramka ‘ворота’ и ‘гол’. Так же устроены и языки, которые заимствовали английское goal во втором и в третьем значении: фарси gol, сербское гол.
Но всё-таки, возвращаясь к словам мяч и шайба в значении ‘гол’ — неужели русский язык один такой? Ovechkin's pucks
В Nature Communications Psychology сегодня вышла статья Цявэнь Лю, Йеруна ван Паридона и Гэри Лупяна, которая показывает, что многие знания о мире можно получать не напрямую с помощью чувств (в данном случае — зрения), а через посредство языка. Оказывается, у незрячих людей ассоциации с цветами (красный — тёплый, синий — холодный, жёлтый — зрелый) примерно такие же, как у зрячих — но они же могли получить их только понаслышке. Несколько примеров — на первой картинке: например, синий у незрячих даже ближе к левому краю шкалы холодный — тёплый, а красный — к правому, чем у зрячих. Но оказалось, что очень похожие результаты можно получить и с помощью семантических векторов, особенно по художественным текстам и субтитрам, и с помощью большой языковой модели GPT-4. Ассоциации зрячих предсказываются чуть лучше, чем незрячих.
(картинка от Антона Кухто)
Удивительный люксембургский язык. Все слова немецкие (Vatikan teilt mit: Der Papst Franziskus ist tot ‘Ватикан общает со: the папа Франциск есть мёртв’), но папу при этом зовут Франсуа. А, ну и ещё употребление артикля французское: по-немецки был бы просто Papst Franziskus, а вот по-французски Le pape François.
Со святыми упокой.
Удивительный люксембургский язык. Все слова немецкие (Vatikan teilt mit: Der Papst Franziskus ist tot ‘Ватикан общает со: the папа Франциск есть мёртв’), но папу при этом зовут Франсуа. А, ну и ещё употребление артикля французское: по-немецки был бы просто Papst Franziskus, а вот по-французски Le pape François.
Со святыми упокой.
Раньше в Национальном корпусе русского языка была лемматизация (приведение к начальным формам) на основе правил. Конечно, у неё было много недостатков — например, слову приписывались все разборы сразу (стали — это и
Сейчас разметка делается более современными нейросетевыми методами и выбирается предпочтительный разбор, но иногда попадаешь в uncanny valley. Вот, например, 37 примеров на местоимение какое-нибудь, которому приписана начальная форма
Иногда это мелочь: ну подумаешь, 37 раз
сталь
, и стать
), и поиск шёл одновременно по всем этим разборам.Сейчас разметка делается более современными нейросетевыми методами и выбирается предпочтительный разбор, но иногда попадаешь в uncanny valley. Вот, например, 37 примеров на местоимение какое-нибудь, которому приписана начальная форма
какое-ний-то
. А по следам недавнего выступления Сергея Шарова на конференции «Диалог» я стал смотреть слова, которые сочетаются с глаголом кишеть
: очень высоко, на 4-м месте стоит черок
. Начинаешь разбираться, а этот черок
имеет именительный падеж множественного числа черви.Иногда это мелочь: ну подумаешь, 37 раз
какое-ний-то
на 6595 вхождений какое-нибудь. Но это непредсказуемо: ищешь лемму чей-нибудь
, находишь 501 пример, но не знаешь, что есть ещё 414 примеров на лемму чой-нибудь
.В продолжение этого поста — хороший мем про неоднозначность конструкций с простым соположением двух слов.
Я много лет преподаю корпусную лингвистику и всё время рассказываю студентам, что относительную частотность удобно измерять в ipm — вхождениях на миллион, instances per million words.
Позавчера я имел такой диалог с немецкой коллегой:
– А почему ты пишешь «ipm»? Я это понимаю, но никогда такого не видела.
– ?! А как?
– «pmw», конечно.
– Никогда такого не видел.
Дальнейшие изыскания показали, что это региональные варианты английского языка: ipm — чешское и русское, pmw — западноевропейское и американское, и мы оба несомненно видели и то и другое, но игнорировали непривычное.
Позавчера я имел такой диалог с немецкой коллегой:
– А почему ты пишешь «ipm»? Я это понимаю, но никогда такого не видела.
– ?! А как?
– «pmw», конечно.
– Никогда такого не видел.
Дальнейшие изыскания показали, что это региональные варианты английского языка: ipm — чешское и русское, pmw — западноевропейское и американское, и мы оба несомненно видели и то и другое, но игнорировали непривычное.
Итак, на этой карте показано, используется ли в названиях США и ОАЭ одинаковое слово или нет. По-русски слова разные: со- и объединённые. И по-арабски, и по-английски — одинаковые. Конечно, интересно было бы узнать, как возникало различие в разных языках: где-то язык изменился за 200 лет между созданием США и ОАЭ (русский; по-исландски и фински причастие стало лучше сложного слова), где-то, наверное, русское влияние (южнославянские языки кроме словенского, латышский, казахский), где-то ещё что-то.
И это я не говорю про Соединённое Королевство и Организацию Объединённых Наций! Но если рассмотреть и их, то США или ООН часто отличается от трёх остальных. На группы 2+2 их разделяют только русский (США = СК ≠ ООН = ОАЭ) и шведский (США = ООН ≠ ОАЭ = СК) языки, а иврит использует аж три слова: одно — для СК и ООН, другое — для США и третье — для ОАЭ.
И это я не говорю про Соединённое Королевство и Организацию Объединённых Наций! Но если рассмотреть и их, то США или ООН часто отличается от трёх остальных. На группы 2+2 их разделяют только русский (США = СК ≠ ООН = ОАЭ) и шведский (США = ООН ≠ ОАЭ = СК) языки, а иврит использует аж три слова: одно — для СК и ООН, другое — для США и третье — для ОАЭ.
🚬 Некий сомнительный журнал Forum for Linguistic Studies прислал мне приглашение что-то там отрецензировать к 6 июня. Рецензировать я, конечно, ничего не буду, тем более к 6 июня, но на сайт журнала зашёл. Первое, что привлекло моё внимание — это статья The Effects of Cigarette Cravings on Word Retrieval Among Smokers (автор — Ahmad Abdulaziz Aljafen). Я было подумал, вдруг там какой-нибудь интересный эксперимент, и заглянул внутрь. Эксперимента не оказалось, а оказался опрос примерно такого типа:
— Заметили ли Вы какие-либо изменения в способности подбирать слова с тех пор, как вы начали испытывать тягу к сигаретам?
— Часто ли вы делаете паузы или колеблетесь в разговоре, пытаясь найти нужное слово, когда Вы ощущаете тягу к сигаретам?
— Замечали ли Вы увеличение ошибок при подборе слов, например использование неверных или слишком общих слов, когда Вы ощущаете сильную тягу к сигаретам?
— Как бы Вы оценили усилия, требующиеся для подбора слов в разговоре в такие моменты?
И — удивительное дело, не правда ли? — люди говорят, что им труднее подбирать слова, когда они хотят курить, а когда они покурили, то становится легче. Великое всё-таки дело наука — чего только она не умеет открыть!..
— Заметили ли Вы какие-либо изменения в способности подбирать слова с тех пор, как вы начали испытывать тягу к сигаретам?
— Часто ли вы делаете паузы или колеблетесь в разговоре, пытаясь найти нужное слово, когда Вы ощущаете тягу к сигаретам?
— Замечали ли Вы увеличение ошибок при подборе слов, например использование неверных или слишком общих слов, когда Вы ощущаете сильную тягу к сигаретам?
— Как бы Вы оценили усилия, требующиеся для подбора слов в разговоре в такие моменты?
И — удивительное дело, не правда ли? — люди говорят, что им труднее подбирать слова, когда они хотят курить, а когда они покурили, то становится легче. Великое всё-таки дело наука — чего только она не умеет открыть!..
А правда же Дин Хёйсен и Даниил Дубов — это один человек?
И принадлежит этот самый Huijsen к категории Chaotic evil: https://www.youtube.com/shorts/A0CIR7_VvVI
А вот бедные испанцы пытаются, пока один голландец не нашёлся: https://www.youtube.com/shorts/J26KB7zFnPo
И принадлежит этот самый Huijsen к категории Chaotic evil: https://www.youtube.com/shorts/A0CIR7_VvVI
А вот бедные испанцы пытаются, пока один голландец не нашёлся: https://www.youtube.com/shorts/J26KB7zFnPo