На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Свежие комментарии

  • Владимир
    Риск снижается, но все равно в итоге приводит к 100 % смертности.Инфаркт миокарда ...

В «языке» диких бонобо смысл фраз не сводится к сумме смыслов слов

Исследования звуковой коммуникации обезьян начинают выходить на новый уровень в связи с появлением методов объективного анализа смысла обезьяньих высказываний. Применение этих методов, отчасти заимствованных из лингвистики, к звукам, издаваемым дикими бонобо, позволило обнаружить в коммуникации наших ближайших родственников свойство, называемое «нетривиальной композиционностью».

Это значит, что смысл составного высказывания формируется на основе смыслов составляющих его элементов, но не сводится к простому суммированию этих смыслов. Нетривиальная композиционность — важнейшая черта человеческого языка, помогающая нам на основе ограниченного числа элементов (морфем, слов) производить бесконечное разнообразие осмысленных высказываний, понятных собеседнику. Ранее это свойство не было надежно документировано ни у одного вида животных, кроме человека.

Знаменитые эксперименты с человекообразными обезьянами, выросшими в окружении людей и обученными тем или иным упрощенным версиям человеческого языка, наглядно показали, что наши ближайшие родственники обладают незаурядными языковыми способностями. В подходящих условиях они могут освоить сотни слов и составлять из них простые фразы. Но как они реализуют эти способности в природе, до последнего времени оставалось неясным.

Сейчас интерес исследователей сместился от лабораторных языковых проектов (рис. 1) к наблюдениям за обезьянами в естественной обстановке. Это позволило обнаружить в звуковой коммуникации высших приматов ряд формальных особенностей, которые прежде считались характерными только для людей (см. «Язык» шимпанзе позволяет из десятка элементов строить сотни фраз с разными смыслами, «Элементы», 30.05.2022).

Поначалу этим исследованиям не хватало одного очень важного аспекта, а именно — серьезных попыток понять и проанализировать смысл обезьяньих высказываний. Однако в последние годы и на этом фронте начали появляться первые успехи. Была разработана и начала применяться методика, позволяющая оценивать смысл высказываний на основе всестороннего анализа контекста, в котором они произносятся, включая изменения в поведении говорящего и слушателей (см. M. Berthet et al., 2023. Animal linguistics: a primer). Этот подход основан на лингвистической гипотезе, согласно которой близкие по смыслу слова используются в похожих контекстах.

Усовершенствованная версия этой методики использовалась в исследовании европейских и американских приматологов и лингвистов, результаты которого опубликованы в журнале Science. Авторы проанализировали звуковую коммуникацию живущих в естественной среде бонобо именно с точки зрения ее смыслового содержания. Они попытались выяснить, есть ли у «языка» бонобо свойство, именуемое нетривиальной композиционностью (см. Principle of compositionality). Так называют ситуацию, когда смысл фразы формируется на основе смыслов ее элементов (слов), но не является простым суммированием этих смыслов. Авторы поясняют идею следующими примерами. Фраза «светловолосый танцор» соединяет два смысла, не модифициуя их. Она указывает на индивида, который, во-первых, светловолосый, во-вторых — танцор. Из нее мы можем сделать вывод, что если данный индивид является вдобавок еще и врачом, то он — светловолосый врач. Это пример тривиальной композиционности, которая иногда встречается в звуковой коммуникации некоторых животных. Напротив, фраза «плохой танцор» не сводится к простой сумме двух сообщений. Если человек плохой танцор, из этого не следует, что он плохой врач. Смысл первого слова не прибавляется к смыслу второго, а модифицирует его. Поэтому фраза «плохой танцор» — пример нетривиальной композиционности. До сих пор, как утверждают авторы, ни для одного вида животных, кроме человека, не было надежных эмпирических подтверждений наличия данного свойства.

Сбор данных проводился в 2022–2023 годах в заповеднике Kokolopori Bonobo Reserve в Демократической Республике Конго. Тамошние бонобо привыкли к присутствию людей и не обращают внимания на ученых, следующих за ними с микрофонами и камерами.

Ученым удалось записать в общей сложности 992 высказывания 30 взрослых бонобо (20 самок и 10 самцов) возрастом от 15 лет и старше из трех разных групп. Последующий анализ позволил выделить в этих высказываниях 12 базовых элементов (элементарных вокализаций), которые произносились либо по отдельности (567 случаев), либо в виде комбинаций (425 случаев). Общее число записанных элементарных вокализаций — 3677 (то есть в среднем по 3,7 на высказывание). И по числу различимых элементарных вокализаций, и по доле составных высказываний эти цифры очень близки к тем, что ранее были получены для обыкновенных шимпанзе (см. упомянутую выше новость).

В рамках данного исследования авторы сосредоточились на 7 наиболее часто используемых элементарных вокализациях (из 12) и на 19 их попарных комбинациях (из 42 возможных, с учетом порядка вокализаций в комбинации). По остальным элементарным вокализациям и комбинациям (в том числе по комбинациям, включающим более двух элементов) не набралось достаточно данных для содержательного анализа.

Чтобы проанализировать смысл сигналов, ученые тщательнейшим образом фиксировали контекст каждого высказывания. Считается, что в коммуникации животных возможны сигналы четырех типов: 1) императивы (когда животное хочет, чтобы другая особь что-то сделала), 2) выражение собственного эмоционального состояния, 3) указание на какие-то внешние события или обстоятельства, 4) информирование слушателей о своих последующих действиях. В соответствии с этим для каждого обезьяньего высказывания исследователи записывали все нюансы происходящего: что делал говорящий в момент высказывания и после (в течение двух минут), каково было его эмоциональное состояние, что делали другие бонобо в зоне видимости, изменилось ли поведение хотя бы одного из них после того, как было произнесено данное высказывание, присоединился ли кто-нибудь к группе, происходили ли какие-то другие значимые события, будь то обнаружение чего-то съедобного или звук бензопилы в отдалении. Всё это многообразие аспектов окружающей реальности было сведено к 300 бинарным параметрам, для каждого из которых в каждом конкретном случае указывалось просто «было» или «не было» (полный список параметров приведен в дополнительных материалах к обсуждаемой статье).

Обработка данных во многом основывалась на подходах, разработанных лингвистами. Всё многообразие контекстов свели к пяти переменным при помощи множественного анализа соответствий (см. Multiple correspondence analysis). Это аналог метода главных компонент для качественных (категориальных) переменных. В итоге получилось пятимерное «семантическое пространство», в котором контекст каждого высказывания (отражающий, по мысли авторов, его смысл) был представлен в виде вектора. Ну а с векторами можно проводить математические операции. Это позволило количественно оценивать смысловые различия между высказываниями (это просто евклидово расстояние между точками в семантическом пространстве), а также сравнивать смысл сложного высказывания со смыслом составляющих его элементарных вокализаций.

Теперь всё было готово для того, чтобы ответить на главный вопрос исследования: присутствует ли в звуковой коммуникации бонобо нетривиальная композиционность. Для этого нужно было последовательно ответить на четыре вопроса:
    1) Различаются ли элементарные вокализации А и Б по своему контексту (смыслу)? Если ответ положительный, можно двигаться дальше.
    2) Отличается ли высказывание АБ по своему смыслу и от А, и от Б? Положительный ответ позволяет перейти к следующему пункту.
    3) Является ли смысл АБ производным от смыслов А и Б? Если ответ положительный, комбинация АБ является композиционной. Но пока еще не ясно, какая это композиционность: тривиальная или нетривиальная.
    4) Отличается ли смысл АБ от А+Б, то есть от простой суммы смыслов А и Б? Если да, то можно сделать вывод, что высказывание АБ обладает нетривиальной композиционностью.

Первую проверку прошли все семь элементарных вокализаций (лишь в двух попарных сравнениях из 21 не удалось обнаружить значимых смысловых различий). Разумеется, при этом учитывалась изменчивость контекста для каждой элементарной вокализации.

Вторую проверку прошли 17 из 19 анализируемых двойных высказываний.

Чтобы ответить на третий вопрос, сравнивали два расстояния в семантическом пространстве: 1) среднее расстояние между высказыванием АБ и его составляющими (А и Б), 2) среднее расстояние между АБ и остальными пятью элементарными вокализациями. Если первое расстояние оказывалось значимо меньше второго, делался вывод, что смысл АБ является производным от смыслов А и Б. Эту проверку прошли 4 из 19 двойных высказываний (рис. 2). О них, таким образом, можно сказать, что они обладают композиционностью, но пока еще непонятно, какой.

Сравнив смысл каждого из этих двойных высказываний с суммой смыслов их составляющих (ведь смыслы, как мы помним, были представлены в виде векторов в семантическом пространстве, поэтому суммировать их было не очень трудно), авторы пришли к выводу, что одно из четырех высказываний (Yelp_Grunt) обладает тривиальной композиционностью. Его смысл не отличается от суммы смыслов элементарных вокализаций Yelp и Grunt. Остальные три высказывания (High-hoot_Low-hoot, Peep_Whistle, Peep-yelp_High-hoot) демонстрируют нетривиальную композиционность: их смысл является производным от смыслов их компонентов, но не сводится к простой сумме этих смыслов.

В заключительной части статьи авторы попытались перевести обезьяньи высказывания с языка бонобо на человеческий, исходя из всех контекстов, в которых данное высказывание употребляется.

Например, вокализация Grunt (ворчание) используется в самых разных контекстах (во время груминга, отдыха, передвижения, кормления) и, по-видимому, сигнализирует о продолжающейся активности говорящего. Смысл ворчания — что-то вроде «посмотри на меня», причем это обращение к особи, находящейся поблизости.

Высокое уханье (High-hoot), вероятно, означает «я здесь» или «обрати на меня внимание» — для более широкой аудитории или на большем расстоянии, чем в случае ворчания.

Низкое уханье (Low-hoot) связано с ситуациями высокого возбуждения, например, при строительстве ночного гнезда («я возбужден»).

Вскрик (Yelp) и писк (Peep) имеют схожие значения и используются как императивы для координации действий. При этом писк чаще выступает в роли предложения, а не приказа или команды. Он реже вызывает изменения в поведении окружающих, а иногда другие особи что-то произносят в ответ на писк. Это может указывать на некое обсуждение или систему, основанную на кворуме. Авторы считают, что писк означает что-то вроде «я хотел бы...».

Вскрик (Yelp) чаще ведет к изменениям поведения слушателей и не сопровождается голосовыми ответами (не обсуждается). Это говорит о более жестком императиве («давайте сделаем это»).

Элементарная вокализация «Peep-yelp» в основном используется при встречах групп и при строительстве ночных гнезд, возможно, для координации межгрупповых взаимодействий и побуждения других присоединиться («присоединяйтесь!»).

Свист (Whistle) служит для координации пространственной сплоченности группы («давайте держаться вместе!»).

Yelp («давайте сделаем это») и Grunt («посмотри на меня») могут объединяться в простую композиционную структуру Yelp_Grunt, которая, по-видимому, побуждает слушателя к строительству ночного гнезда.

Высокое уханье («обрати на меня внимание») может сочетаться с низким уханьем («я возбужден») в нетривиальную композиционную комбинацию High-hoot_Low-hoot, которая используется, когда другой индивид что-то демонстрирует. Возможно, данная фраза произносится, чтобы вызвать реакцию аудитории и пресечь демонстрацию («Обратите на меня внимание, потому что я расстроен»).

Peep («я хотел бы...») может соединяться с Whistle («давайте держаться вместе») в нетривиальную композиционную комбинацию Peep_Whistle, которая используется в чувствительных социальных контекстах (например, во время спаривания или демонстраций), возможно, чтобы привлечь внимание или заявить о своем ранге.

Наконец, Peep-yelp («присоединяйтесь!») в сочетании с High-hoot («обрати на меня внимание») дает нетривиальную композиционную структуру Peep-yelp_High-hoot, которая, по-видимому, используется для координации действий с другими группами перед перемещением на новое место.

Исследование интересно прежде всего с методологической точки зрения. Ведь это одна из первых серьезных попыток анализа смыслового содержания языка обезьян при помощи строгих лингвистических методов, с минимальной долей субъективных оценок. Но интересны и конкретные выводы, касающиеся обнаруженной композиционности.

На композиционности основано важнейшее свойство человеческого языка — генеративность, то есть способность производить из ограниченного числа элементов бесконечное разнообразие высказываний, смысл которых понятен собеседнику. В звуковой коммуникации некоторых животных ранее уже была обнаружена зачаточная композиционность. Однако в прежних исследованиях речь шла, как правило, лишь о какой-то одной комбинации осмысленных сигналов (см. S. Engesser et al., 2016. Meaningful call combinations and compositional processing in the southern pied babbler; M. Leroux et al., 2023. Call combinations and compositional processing in wild chimpanzees). Результаты нового исследования более масштабны: у бонобо зафиксировано четыре композиционные структуры, причем все семь рассмотренных в работе элементарных вокализаций входят в состав хотя бы одной из них. Это говорит о том, что для звуковой коммуникации бонобо композиционность — обычное дело. Ведь нужно еще учитывать, что вокализации, рассмотренные в статье — лишь верхушка айсберга. Реальный лингвистический репертуар бонобо, скорее всего, значительно шире.

Нетривиальная композиционность — комбинирование осмысленных элементов, порождающее новый смысл, производный от смыслов элементов, но не сводимый к их сумме — особенно важна для генеративной способности человеческого языка. В обсуждаемой статье впервые получено весомое подтверждение наличия этой особенности у кого-то, кроме человека.

Как у всякого новаторского исследования, у работы есть немало ограничений, и авторы это осознают. В частности, они допускают, что некоторые выделенные ими элементарные вокализации в действительности могут оказаться двумя или более разными, хотя и похожими вокализациями. Список учитываемых параметров контекста может быть существенно расширен, в частности, за счет объективных признаков эмоционального состояния обезьян (например, полезны были бы данные инфракрасной термографии), а также за счет более полного учета поз, жестов и мимики, которые тоже могут модифицировать смысл звуковых сигналов. За рамками исследования остались 13 двойных высказываний, которые прошли вторую проверку, но не прошли третью. Пусть эти высказывания не удовлетворяют критериям композиционности (потому что не удалось доказать, что их смысл является производным от смыслов их элементов), но всё же они могут оказаться интересными и важными примерами комбинаторного формирования новых смыслов из ограниченного набора элементов. Наконец, объем изученной выборки не так уж велик для подобных исследований (всего 992 высказывания). Одним словом, обезьяньей лингвистике еще есть куда развиваться.

Источник: M. Berthet, M. Surbeck, S. W. Townsend. Extensive compositionality in the vocal system of bonobos // Science. 2025. DOI: 10.1126/science.adv1170.

См. также:
1) «Язык» шимпанзе позволяет из десятка элементов строить сотни фраз с разными смыслами, «Элементы», 30.05.2022.
2) Шимпанзе чмокают губами в ритме, характерном для человеческой речи, «Элементы», 02.06.2020.
3) Предупреждая сородичей об опасности, шимпанзе учитывают степень информированности слушателей, «Элементы», 21.11.2017.
4) Голландские шимпанзе перешли на диалект своих шотландских родичей, «Элементы», 18.02.2015.
5) Обезьяны осмысленно пользуются человеческими жестами, «Элементы», 12.12.2008.
6) Мартышки произносят фразы из двух слов, «Элементы», 21.05.2006.

Александр Марков

Adblock test (Why?)

Ссылка на первоисточник
наверх