Лингвисты под руководством Франсуа Пеллегрино из Лионского университета решили подсчитать скорость передачи информации для одной единицы в речи 17 языков представителей австроазиатских, индоевропейских, сино-тибетских, тюркских, уральских, и тай-кадайских семей, а также баскского, японского и корейского. В качестве языковой единицы для анализа ученые выбрали слог. Выбранные для анализа языки существенно отличаются количеством возможных для них слогов: скажем, в английском языке слогов около семи тысяч, в то время как в японском — всего лишь несколько сотен. При этом и японский, и английский позволяют своим носителям одинаково эффективно передавать информацию друг другу. Интересно, поэтому, посмотреть, как различается информационная плотность каждого слога и то, как от нее зависит скорость передачи информации.
Для этого ученые попросили 170 носителей 17 использованных языков прочитать 15 коротких семантически связанных текстов: тексты необходимо было прочитать несколько раз, чтобы в итоговой версии участники не сбивались и читали текст четко. Записи зачитанных текстов разделили на отдельные слоги: следует уточнить, что учитывались только канонические для определенного слова слоги вне диалектных вариантов.
Далее ученые рассчитали два параметра: скорость речи (количество слогов, произнесенных в секунду) и информационную плотность (сколько информации в битах несет один слог в языке). Последний параметр рассчитали по письменному корпусу каждого языка: от отражает то, сколько бит информации переносит каждый отдельный слог (если просто — сколько семантической информации несет один слог языка на основе одинаковых по содержанию текстов из разных языков).
Несмотря на то, что языки отличались как по информационной плотности, так и по скорости речи, ученые заметили закономерность: менее «плотные» языки отличаются быстрой речью, в то время как языки с большей информационной плотностью — речью медленнее. Например, во вьетнамском — языке с плотностью 8 бит на слог — скорость речи составляла около 5 слогов в секунду, в то время как в финском информационная плотность была около 5,5 бита на слог, а скорость речи — чуть больше 7 слогов в секунду. С учетом наличия подобной линейной зависимости авторы рассчитали, что в среднем во всех изученных языках скорость передачи информации (информационная плотность умноженная на скорость речи) составляет около 39,5 бита в секунду. Вероятно, этот показатель может претендовать на роль универсального параметра, характерного для всех естественных языков.
«Вокруг Света. Украина» писал о самых редких языках мира.
По материалам Nplus1
Читайте также:
В Канаде сняли фильм на самом сложном языке в мире
Названы пять самых изучаемых языков на планете
В интернете спасают нанайский язык