Сейчас на сайте

На данный момент сайт просматривают 167 читателей.

Язык звуков: эмоции у людей и обезьян

Опубликовано: Olleg 27|04|2017 || Просмотров: 6252

Почему люди и обезьяны общаются сходным образом, как связаны эмоции и происхождение языка и как изучают речевые сигналы

У животных, в отличие от человека, нет речи в привычном понимании этого слова. Но это не мешает им общаться между собой и делиться различными эмоциями: радостью, страхом, предупреждать собратьев об опасности.

Кроме того, у некоторых животных, в особенности обезьян, есть немало общего с звуковым языком наших предков. Это обусловлено физиологическими характеристиками и особенностями артикуляции, а также условиями взаимодействия и общения между особями внутри группы.

Эмоциональные звуки связаны с происхождением речи. Эмоциональные сигналы людей и животных изучаются психологами, биологами и лингвистами, и эти исследования подтверждают сходство звукового языка обезьян с проявлениями эмоций в человеческой речи. Но почему так происходит и как ученые получают эту информацию?

Звуковая коммуникация

Звук, звуковая волна имеет большое значение в эволюции жизни на Земле, поскольку она служит самым «перспективным» средством передачи информации в мире живых существ, что доказывается фактом появления звуковой речи и сознания у человека. Несмотря на то что животные не говорят между собой в нашем человеческом понимании, язык звуков ― немаловажный и для них способ общения. Сейчас уже никто не отрицает, что звуковая коммуникация, наряду с другими каналами, широко распространена в животном мире, а эмоциональные реакции, хотя бы простые, свойственны не только человеку, но и большинству животных, не говоря уже об обезьянах. Речь животных имеет свою эволюцию: исторически звук проделал путь от инструментального «механического» голоса к «истинному» голосу, использующему воздушную струю.

С помощью модуляций голоса (известны три основных вида модуляций ― амплитудная, частотная и фазовая) животные могут вкладывать в издаваемые ими звуки разнообразную информацию и кодировать ее большой объем в коротких сигналах. Например, А.А. Никольский в звуковых сигналах млекопитающих обнаружил пять вариантов амплитудной модуляции: ее отсутствие, непрерывную, фрагментарную, гетерогенную и многоуровневую. Одни и те же формы амплитудной модуляции могут встречаться параллельно в звуках, издаваемых представителями различных отрядов млекопитающих. И напротив, различные ее формы обнаружены в сигналах, выполняющих одну и ту же функцию.

Обстоятельные исследования акустической структуры обезьяньего языка, проведенные в лаборатории Г.В. Гершуни, показали, что в обезьяньем языке имеется много звуковых элементов, сходных по звучанию с фонетическими элементами человеческой речи ― гласными, согласными, слогами. Но самым интересным оказалось, что эмоциональное значение голосовых звуков обезьян — угрозу, страх, радость, настороженность, гнев, удовольствие, жалобу и т. п. ― слушатели-люди воспринимают совершенно адекватно, то есть правильно (с вероятностью до 95%) определяют то эмоциональное состояние, в котором находилось животное, издавая соответствующие звуки.

При этом у современных обезьян средства общения, коммуникации отличаются не только своим многообразием, но и выраженной адресованностью и выполнением побуждающей функции, направленной на изменение поведения членов стада. Эти звуки имеют определенный смысл, как показали исследования Н.И. Жинкина звуковой коммуникации обезьян в Сухумском обезьяньем питомнике. Спрятавшись за большой камень в свободном вольере, Николай Иванович издавал похожие на «обезьяний язык» звуки. Настороженное молчание обитателей вольера вскоре начинало прерываться ответными криками, или же животные убегали. Эти реакции означали, что издаваемый человеком звук понят, то есть коммуникация установлена.

Замечено также, что в некоторых пределах эти звуки самодостаточны и правильно воспринимаются даже в записи. Часто приводится такой пример наблюдения. В яркий солнечный день стадо обезьян резвилось в заповеднике. Вдруг неожиданно набежала туча и пошел дождь. Обезьяны с криками скрылись под навесом. Звуки их голосов при этом были записаны на магнитофон. В другой такой же солнечный день, когда дождя совсем не предвиделось, эти магнитофонные записи были воспроизведены резвящимся обезьянам. В результате обезьяны, услышав свои крики, устремились под навес. Но следует ли из этого заключать, как Н.И. Морозов, что в «лексиконе» обезьяньего языка есть звуки, обозначающие «дождь»? Или это просто сигнал-предупреждение, побуждающий прятаться? Н.И. Тих считает, что, в отличие от человека, у обезьян коммуникативные средства: звуки и телодвижения лишены семантической функции и поэтому не служат орудием мышления.

Характерные особенности звуковой коммуникации обезьян

Коммуникация у высших обезьян носит неспецифический характер: акустические сигналы неспецифичны, а ритуализированные демонстрации редуцированы. Пример неспецифической успешной коммуникации ― это так называемый «пищевой крик» цейлонских макак (Macaca sinica). Эмоциональной основой крика служит общее возбуждение, своего рода эйфория, стимулированная находками новых источников или видов пищи. Доказательством неспецифичности сигнала служит тот факт, что индивидуальные различия в реактивности макак существенно влияют на интенсивность звуковой активности и на частотные характеристики самих звуков. К тому же признаки сигнала не зависят от конкретных особенностей пищевых объектов, то есть пищевой сигнал макак лишен иконического смысла. Такой неспецифический пищевой крик тем не менее служит эффективным и надежным средством коммуникации. В адекватной ситуации крик зарегистрирован в 154 случаях из 169. Положительная реакция других особей на крик обнаружена в 135 случаях из 154. Члены стада, услышавшие крик, сбегаются на него с расстояния до 100 м.

Таким образом, можно отметить большую выразительность и разнообразие звуковых средств общения обезьян (в частности, у всех узконосых обезьян звук играет важную роль в коммуникации), а также сходство их звуков с эмоциональными средствами коммуникации у человека. При этом все же остается проблема интерпретации звуковых сигналов животных: правильное распознавание их человеком базируется на его собственном «здравом смысле» и его же интерпретации ситуации (которое может и не совпадать с восприятием данной ситуации животными). Но что тогда означает факт правильного и точного опознания человеком эмоций животного по его крику? Может быть, только простое соответствие созданных им по своим понятиям классов криков и ситуаций (что тоже немаловажно), но вовсе не соответствие эмоций, которые должны испытывать животные, тем эмоциям, которые испытывал бы сам человек в этой ситуации.

То есть получается порочный круг, когда исходная аксиома, что человек способен классифицировать ситуации и соответствующие им звуки на основании собственных признаков, превращается в утверждение ― эти же признаки приписываются животным. Вопрос остается открытым, пока не будет разработан объективный метод сопоставления соответствующих звуковых сигналов и определения соответствия качества эмоций человека этим звуковым сигналам. Только тогда можно будет по-настоящему доказать наличие сходства эмоциональных звуковых сигналов человека и животных и доказать предположение, выдвинутое еще Ч. Дарвином , о родстве эмоций человека и обезьян.

Что касается речевых способностей ныне живущих видов обезьян, то принципиальная невозможность обучения их членораздельному языку была неоднократно доказана. Как же возникла речь у человека, если он произошел от общих с обезьянами предков? Что должно было измениться у человека, чтобы он приобрел способность к членораздельной речи? Или что было утрачено нынешними видами обезьян, из-за чего они утеряли такую возможность?

О специфике звукопроизводства обезьян и человека

По сравнению с человеком, у обезьян (в частности, у шимпанзе) слишком высоко расположена гортань. Это очень удобно, поскольку позволяет есть и дышать практически одновременно. Низкое же положение гортани открывает возможности для четкого произнесения звуков человеческого языка. У человеческих младенцев гортань, как и у шимпанзе, расположена высоко (это позволяет одновременно сосать и дышать). Примерно к трем годам гортань опускается, и это приблизительно совпадает со временем полного овладения звуковой стороной языка. Справедливости ради следует сказать, что положение гортани не остается неизменным в течение жизни не только у человека: по данным группы японских ученых, некоторое опускание гортани наблюдается и у шимпанзе.

Относительно того, для чего нужно низкое положение гортани, существует несколько гипотез. Согласно одной, представляющейся наиболее правдоподобной, это необходимо именно для членораздельной звучащей речи, поскольку дает возможность языку двигаться внутри речевого тракта ― как в горизонтальной, так и в вертикальной плоскости, что, в свою очередь, позволяет создавать различные конфигурации ротовой полости и глотки независимо и тем самым сильно расширяет набор возможных фонем, различающихся по тому, на каких частотах звук усилен, а на каких, наоборот, приглушен. Такое понижение гортани дает возможность издавать более низкие звуки. Таким образом, низкое положение гортани можно рассматривать как видовой признак ― это одно из приспособлений для членораздельной звучащей речи.

Кроме этих анатомических особенностей можно упомянуть об отсутствии у человека естественных диастем (промежутка между зубами, в котором размещаются клыки, например, у шимпанзе), а также об отличающейся от человеческой лицевой мускулатуре обезьян и о небольшом по сравнению с гейдельбергским человеком, палеоантропом и неоантропом диаметре позвоночного столба в грудном отделе, что свидетельствует об отсутствии способности к тонкому регулированию потока воздуха, направляемого на голосовые связки, т. е. на отсутствие специального, речевого режима дыхания у обезьян. Немаловажным является и тот факт, что обезьяны с одинаковым комфортом извлекают звук как на выдохе, так и на вдохе, в то время как голосовая щель человека приспособлена к тому, чтобы управляемо работать только на выдохе.

Звуки у обезьян и людей: общее и разное

У некоторых видов приматов, в том числе у человека и шимпанзе, в дополнение к истинным голосовым складкам имеется пара ложных голосовых связок, развитых значительно слабее. При этом шимпанзе, в отличие от человека, может использовать при звукопроизводстве обе пары связок независимо, хотя их активация требует большего давления воздушной струи. У человека ложные голосовые связки могут начать использоваться только после специальной программы тренировок, например при горловом пении или в результате лечения у логопеда, когда выходят из строя истинные голосовые связки. У всех гоминоидов, кроме людей, имеются так называемые горловые (или гортанные) мешки, которые создают при производстве звука дополнительный низкочастотный резонанс, из-за чего частоты оригинальных резонансов смещаются и сближаются, что негативно влияет на различимость звуков по тембру.

«Правильная» конструкция и функционирование моторного аппарата может иметь значение не только для производства речи, но и для ее восприятия. Противоречие между наблюдаемым разнообразием акустических параметров и кажущейся устойчивостью восприятия фонетических элементов речи человеком привели к формулировке различных вариантов моторной теории восприятия речи. Представление о том, что при восприятии речи каким-то образом используется информация о свойствах речеобразования, опирается на способность человека к обучению речи. Определенную роль сыграло и явление так называемой внутренней речи, т. е. наблюдающееся иногда проговаривание «про себя» читаемого текста. Накапливались и наблюдения за компенсацией естественных и искусственных нарушений процесса образования или восприятия речи.

Неврологам и логопедам давно известно, что при парезе (параличе) отдельных лицевых или внутриротовых мышц разборчивость речи может и не пострадать. Например, при парезе мышц, управляющих движениями нижней челюсти, артикуляция губных звуков осуществляется за счет большей амплитуды движений губ. Начиная носить зубные протезы с искусственным твердым небом, в ряде случаев люди сохраняли разборчивость своей речи. Иногда больные с удаленной гортанью полностью восстанавливали в своей речи не только различие между звонкими и глухими согласными, но и правильную фразовую интонацию и даже могли петь. Имеются сведения о том, что замена удаленного языка пластиковым протезом позволила больному сохранить сравнительно разборчивую речь. Все эти факты говорят о широком диапазоне возможностей подстройки речевого аппарата и устойчивости системы восприятия и порождения речи в целом.

Откуда появляется речь

Предложенная В.Н. Сорокиным теория внутренней модели объединяет процессы образования и восприятия речи и позволяет понять механизм вышеописанной устойчивости. Внутренняя модель является элементом системы управления артикуляцией, обеспечивая текущий контроль и коррекцию артикуляции при различных нарушениях путем решения обратных задач: «проприоцепция ― управление» и «акустика ― управление». Для успешной деятельности внутренняя модель должна основываться на данных механики, аэродинамики, акустики речеобразования и фонетике языка. Было установлено, что при наличии акустической информации нет необходимости измерения всей формы речевого тракта ― достаточно знания о положении губ, нижней челюсти и передней части языка. Тем самым при решении задач коррекции артикуляции или компенсации нарушений ослабляются требования к точности проприоцептивных сигналов.

Это повышает вероятность того, что система управления артикуляцией способна решать обратные задачи с целью контроля качества генерируемого речевого сигнала и соответствия его установившимся фонетическим нормам в данном языке. С помощью вычислительного эксперимента было также показано, что форма речевого тракта, выявленная посредством решения обратной задачи с использованием одновременно и акустических, и артикуляторных данных, хорошо совпадает с результатами, полученными на основе одних только акустических параметров. Это означает, что такая организация восприятия и порождения реальной речи вполне возможна. В процессе этих исследований было также установлено, что для успешного решения обратной задачи можно использовать не только формальные процедуры, но и так называемую кодовую книгу. Ее идея состоит в предварительном вычислении набора соответствий между заданными векторами артикуляторных параметров и соответствующими им векторами акустических параметров. Можно предположить, что, начиная с периода детского лепета, внутренняя модель, пользуясь методом проб и ошибок, отслеживает процесс изменения анатомических размеров речевого тракта и соответствующим образом корректирует содержание «кодовой книги».

Примеры восстановления голосового источника после удаления гортани указывают также на удивительную пластичность системы управления речеобразованием, способной не только отслеживать возрастные изменения параметров речевого тракта, но и менять саму структуру внутренней модели. При этом роль суррогатного голосового источника принимает на себя сфинктер, образованный пищеводом и мышцами-сжимателями глотки, которым и передаются тонкие функции мышц удаленной гортани. Все это говорит в пользу того, что «функция», т. е. необходимость говорить, в значительной степени определяет и «структуру» ― способ управления речедвигательным аппаратом. Поэтому аргумент об отсутствии у обезьян и до какого-то момента у наших предков хорошо приспособленного к речи голосового аппарата как причины отсутствия у них речи некорректен. Скорее, наоборот, отсутствие необходимости речи («функции») не приводит к изменениям структуры. По-видимому, речь могла начать формироваться раньше, чем произошли анатомические изменения, которые ныне хорошо заметны при сопоставлении человека с неговорящими обезьянами и которые являются уже результатом (и показателем) развития речи, а не условием ее становления.

Эмоции и происхождение языка

Нынешний человек и нынешние обезьяны различаются и строением речевого аппарата, и возможностями звуковой коммуникации. Но каким был язык, речь человека, когда человек только начал выделятся из мира животных? Чем различаются и чем сходны звуки, издаваемые в различных ситуациях современными животными, хотя бы теми, что генетически ближе всего к человеку, ― обезьянами, от звуков человеческой речи? Вопрос о происхождении языка занимал многих выдающихся мыслителей, но ставился и решался весьма различно. Среди множества теорий можно упомянуть теорию эмоционального происхождения языка и развивающую ее теорию междометий. Родоначальником этой теории был Жан-Жак Руссо (1712–1778). В своем трактате по поводу происхождения языков Руссо писал, что первый язык человека, наиболее всеобщий, наиболее выразительный и единственный язык, ― это крик самой природы. Так как этот крик исторгался у человека лишь силою некоторого рода инстинкта в случаях настоятельной необходимости, чтобы умолять о помощи при большой опасности или при тяжких страданиях, то им редко пользовались в повседневной жизни, где царят чувства более умеренные.

Когда представления человека стали расширяться и усложняться, когда между людьми установилось более тесное общение, они постарались найти знаки более многочисленные и язык более развитый. Они увеличили число изменений голоса и присоединили к ним жесты, которые по природе своей более выразительны и смысл которых менее зависит от предварительного условия. Эмоциональная теория Руссо получила развитие и стала называться теорией междометий. Один из защитников этой теории русский лингвист Д.Н. Кудрявский (1867–1920) считал, что междометия были своеобразными первыми словами человека. Междометия являлись наиболее эмоциональными словами, в которые первобытный человек вкладывал различные значения в зависимости от той или иной ситуации. По мнению Кудрявского, в междометиях звук и значения еще были соединены неразрывно. Впоследствии, по мере превращения междометий в слова, звук и значения разошлись, причем этот переход междометий в слова и был связан с возникновением членораздельной речи.

Язык предков

Однако язык эмоций современных животных, в том числе обезьян и, по-видимому, предков человека, вполне достаточен, чтобы они могли решать все свои проблемы взаимодействия в группе, в том числе и повседневного, не требующего крайнего напряжения. Оставляя вопрос о причинах или движущих силах эволюции языка, приведших к появлению человеческой речи, вернемся к вопросу средств и «технической» базы развития звуковой речи. Сохранилась ли у человека первобытная система звуковой эмоциональной коммуникации в неприкосновенности, продолжая сосуществовать в качестве системы выражения чувств, параллельно с возникшей независимо звуковой системой членораздельной речи? В звучащей нормальной речи современных людей эмоциональная составляющая вполне хорошо заметна. Благодаря ей бывает можно понять, является ли говорящий радостным или огорченным, разгневанным, испуганным, удивленным и т. д. Эта составляющая может быть выделена даже тогда, когда слова разобрать по тем или иным причинам невозможно.

Отличить просьбу от утвердительного ответа или отказа несложно при прослушивании магнитофонных записей «высказываний», произнесенных детьми, которые еще не овладели словами. Как же эта эмоциональная составляющая взаимодействует со звуковой системой членораздельной речи? Может быть, в ходе развития языка она трансформировалась таким образом, что новая система членораздельной речи использовала, хотя бы частично, ее средства и «потеснила» ее в звуковом сигнале? Если эмоциональная звуковая система человека является общим наследием его предков и ныне живущих родственных видов обезьян, то она должна быть так схожа у них, как и у разных видов современных обезьян между собой. Если же развитие человеческого языка пошло по пути редукции эмоциональной составляющей и развития членораздельной речи на ее основе, то можно ожидать существенного различия этих сигналов.

Задачей данного исследования было формально сопоставить структуру голосовых сигналов обезьян и эмоциональных сигналов человека.

Проведение исследований

Ученые провели ряд экспериментов, используя новый метод автоматического распознавания эмоций человека по речевому сигналу. Предложенный метод базируется на четырехмерной сферической модели эмоций и принципах кодирования информации в нервной системе. В результате экспериментальной проверки предложенного принципа относительного кросс-частотного амплитудно-вариабельного кодирования эмоций человека в речевом сигнале были выделены параметры звукового сигнала, хорошо соответствующие модели эмоций. Применение этого же метода к образцам звуковых сигналов обезьян позволяет формально количественно описать характер этих сигналов и сопоставить их с эмоциональным компонентом речевой продукции человека. В рамках исследования были проанализированы четыре группы данных ― специально записанные крики макак-резусов в различных условиях, документированные и интерпретированные опытными зоологами биологического факультета МГУ им. М. В. Ломоносова. Каждый файл соответствовал определенной ситуации: экспериментатор входит в помещение; экспериментатор раздает обезьянам еду; дразнит обезьян палкой, рукой или водой; экспериментатор надевает карнавальную маску и так далее. Кроме того, использовались видеозаписи с криками сиаманга (гиббона), записи криков шимпанзе и павианов. Необходимые показатели вычислялись при помощи специального алгоритма.

Для наблюдения за обезьянами были созданы специальные условия. В комнате в изолированных клетках в условиях отсутствия физического контакта и затрудненной зрительной коммуникации находятся пять обезьян. Одна из них явный лидер (доминант), остальные четыре ― субдоминанты. Ранговость между субдоминантами неясна. Вероятно, один из них является субдоминантом низшей ступени.

Для каждого файла записи звуков указывалось количество криков в записи, для каждого крика (по порядковой нумерации в каждой записи) отмечена его вероятная функциональная роль, статус обезьяны, которая его производит, и вероятная причинная связь с предыдущими криками в записи (если есть). Были приняты обозначения и выделялись в записи следующие варианты функциональной роли криков обезьян: «приветствие» — крик, явно адресованный экспериментатору; «просительный/подчиненный» ― крик, выражающий явную степень подчинения (зависимости?), свойственен фактически только одной обезьяне с самым низшим статусом; «пищевой/получение пищи» ― выражение удовлетворения при получении обезьяной пищи; «испуг/агрессия» ― смешанная реакция одновременного выражения испуга и попытки напугать атакующего. Были выделены и такие обозначения, как «испуг» (выражение чистого испуга, как правило, возникает у субдоминантов низших статусов) и «коммуникация» ― все остальные крики без явной причины в окружающей обезьяну обстановке, роль которых трудно установить. Несомненна их коммуникативная роль в ситуации, когда одна обезьяна таким криком пытается установить звуковой контакт, а другая(-ие) подтверждают его и возникает «перекличка». В остальных случаях роль таких звуков неясна.

Обсуждение результатов

Полученные результаты позволяют вернуться к вопросам, поставленным во введении. Итак, обнаружено, что первобытная система звуковой эмоциональной коммуникации, наблюдаемая у современных обезьян и, по-видимому, характерная также для предков человека, сохранилась в неприкосновенности и у сегодняшнего человека, продолжая сосуществовать в качестве системы выражения чувств, параллельной с возникшей независимо звуковой системой членораздельной речи. Оказалось, что у сиамангов (гиббонов) тоже произошло усложнение репертуара звуковых сигналов, причем старая система не пострадала. Дополнительная система в ходе развития заняла свободную частотную «нишу», чтобы не «потеснить» старую в звуковом сигнале. Совпадение факторных характеристик вокализации макак, павианов, шимпанзе и человека показывает, что данное усложнение является инновацией, которая произошла в эволюционной линии, ведущей к гиббонам (после их отделения от прочих человекообразных обезьян). В дальнейших исследованиях можно проверить, существует ли такая же система звуковой сигнализации у других видов животных.

В целом полученные результаты о сходстве кодирования эмоций человека и обезьян хорошо согласуются с известными фактами о том, что эмоциональное значение голосовых звуков обезьян люди-слушатели воспринимают совершенно адекватно, то есть правильно определяют то эмоциональное состояние, в котором находилось животное, издавая соответствующие звуки. Эти результаты подтверждают также правоту Ч. Дарвина, писавшего об общности голосовых средств выражения эмоций у человека и высших животных.

Полученное хорошее согласие параметров речевого сигнала не только человека, но и обезьян с параметрами психофизиологической модели эмоций подтверждает теоретические представления о принципах кодирования информации в нервной системе и продуктивности предлагаемого антропоморфного подхода к разработке технических систем, в частности методов обработки речевого сигнала. С другой стороны, обнаруженное совпадение подтверждает и выделенные ранее параметры психофизиологической модели, дополнительно обосновывая предпочтительность (по сравнению с другими известными в литературе) именно такой системы классификации эмоций как с точки зрения размерности, так и в отношении ориентации осей пространства модели.

В то же время необходимо отметить, что выделенная система звукового кодирования эмоций основана на относительной амплитудной микромодуляции сигнала в четырех разных частотных областях. Интересен вопрос о развитии членораздельной речи человека: появилась ли эта способность на базе такого же принципа кодирования, как у сиаманга (гиббона), или же для нее возник другой способ кодирования (возможно, частотный или фазовый)? Все это требует продолжения исследований звуковых сигналов животных и человека.

Выводы из исследования

С помощью формальных объективных методов анализа показано принципиальное сходство звуковых сигналов обезьян разных видов: шимпанзе, макак-резусов, павианов и сиамангов (гиббонов) ― с проявлениями эмоций в речи человека. Это свидетельствует о древности эмоциональной системы регуляции и о том, что она сохранилась у человека в неприкосновенности, продолжая сосуществовать в качестве системы выражения чувств, параллельно с возникшей независимой звуковой системой членораздельной речи.

Разработанная (на основе принципа относительного микроамплитудного кросс-частотного кодирования) система формальных параметров оценки эмоций в речи человека хорошо применима в качестве экспериментальной процедуры для объективной оценки и интерпретации (в соответствии с системой человеческих эмоций) звуковых сигналов обезьян. Это подтверждается обнаруженным соответствием формальных оценок с результатами наблюдений за поведением животных в разных ситуациях.

Показано, что для большинства обследованных видов обезьян (шимпанзе, макак-резусов и павианов) весь репертуар звуковых сигналов исчерпывается одним видом эмоциональной регуляции, но существуют виды, например сиаманг (гиббон), у которых система голосовых сигналов получила развитие, ― в частности, появилась дополнительная система изменения звукового сигнала, основанная на том же принципе кодирования, что и общая эмоциональная.

Полная версия статьи была опубликована в «Национальном психологическом журнале», №4(16)/2014.

Источник