Психоакустика восприятия и порождения устной речи

Периферические механизмы речи

Эксперименты начала века, когда только провели телефонные линии. Тогда проводили много экспериментов о том, как человек воспринимает переданную по телефону информацию в условиях разного шума. Придумали словесную разборчивость и слоговую (слоги, конечно же, были бессмысленными). Получились интересные кривые. Например, в одном и том же шуме человек правильно воспринимает 20% слогов и 70% слов. Значит, слова ему воспринимать легче, они более устойчивы к зашумлению. Потому что в голове есть эталон, есть контекст, есть ожидания. Вывод: восприятие речи – процесс top-down, и это хорошо согласуется с Александровым.

Есть теория, что вход в сенсорные системы изначально очень зашумлен, чтобы у психики в процессе восприятия были определенные степени свободы, чтобы мир не воспринимался жестко. Получается, что психика все время фильтрует шум и отфильтровывает то, что ей нужно или знакомо. В том эксперименте слова заменили короткими стандартными фразами, и кривая еще круче пошла вверх.

Дыхание – предшественник устной речи. Затем – вокализация, т.е. особый способ изменения выдоха. Животное тоже так умеет. Получается крик – тоже вполне себе средство коммуникации. Насчет коммуникативных функций таких вокализаций – большой вопрос. Может, они просто экспрессируют. Но у высших приматов вокализации явно дорастают до коммуникативных функций. Причем нам многие их вокализации понятны. Видимо, общие корни.

Дальше – связки. Они могут сужаться (до полного замыкания пути для воздуха) и расширяться. Они тоже изменяют выход воздуха. Связки работают циклично, на частоте примерно 100-200Гц. Причем частоту они меняют. Потому что иначе мы не могли бы передать ничего интересного. А так, игра связок с частотой вносит огромный объем информации.

Тембр. У мальчиков связки жестче и сокращаются с меньшей частотой. У девочек – наоборот. Заболел – еще иначе зазвучал от того, что заработали иначе связки.

Дальше – резонансный артикуляторный аппарат. Резонанс – это такой физический процесс, когда два явления совпадают по фазе и усиливают друг друга. (Играющий мост в Самаре, лопающийся от звука бокал, летучий голландец (в море иногда возникают инфразвуковые волны 5-6Гц, они совпадают с колебаниями диафрагмы, что вызывает животный ужас – и все прыгают за борт.)) Каждое конкретное положение нашего артикуляционного аппарата – это структура, имеющая свою резонансную характеристику. Причем она меняется от звука к звуку. Волна, прошедшая через связки вступает в полости, и начинается резонанс. И этот резонанс всегда разный, всегда на разных частотах. Вступают в резонанс не все частоты, а только те, которые есть в речевом аппарате.

Формант – пик на спектре воздуха, вышедшего из нашего рта. Эти пики берутся из резонансной характеристики нашего артикуляторного аппарата. Разные фонемы кодируются формантами. Гласные звуки укладываются в треугольник в системе координат из первой и второй форманты, т.е. они неплохо кодируются этими формантами. Причем каждая гласная гуляют в некоторых пределах вокруг средних значений.

Первая гипотеза – про зеркальные нейроны. Есть еще одна интерпретация на этот счет. Сферическая модель и предетекторы. А зеркальный нейрон, по сути, объединяет в себе функцию предетекторов и командных нейронов. Любые нейроны на речь формируются при-жиз-нен-но. Еще об этом: предетекторы – это часть неречевого слуха. А вот детекторы – это уже при жизни и социально.

Можно построить и динамическую спектрограмму. Х – время, У – вклад разных частот в спектр. Такой спектр отражает уже не отдельный звук, а речь. Интервалы между словами и между фонемами очень условны. Наша речь достаточно слита.

Проблема автоматического распознавания речи. Есть принципиальная граница: машина не знает всего контекста, а восприятие речи – процесс top-down. Ну и еще одна проблема, связанная со слитостью речи. Мы-то слышим непрерывное ляляля, а уже психика «мощно вычерпывает» в этом ляля то, что может оказаться словом. Из физических характеристик это не очень-то следует.

Красивые кривульки на фразу «это мамонт». Траектория изменения частоты колебания связок много чего меняет в смысле речи. Интонация фразы «это мамонт» меняет всю структуру предложения и смысл. Акцент во многом связан с тем, что люди не могут копировать мелодический контур иностранного языка. А мелодический контур это что? Работа связок. А это процесс какой? Во многом автоматический, поэтому слабо поддается контролю и тренировке.

Частота основного тона. Это доартикуляционный, очень древний механизм. Еще приматы начали использовать модуляцию этого параметра для передачи некоторой информации. 248Гц – женщины, 136Гц – мужчины, дети – примерно столько же, сколько у женщин. Система безопасности рефлекторная реагирует тоже во многом на частоту голоса.

Можно говорить, что речевая информация делится на два канала

· Лингвистический. Кодирует конкретно смысл, это уровень артикуляции. Эмоциональный контур ему пофигу.

· Экстралингвистический. Все, что не связано с конкретным лингвистическим смыслом. Исходно это – связки. Частота основного тона – один из мощнейших механизмов для передачи информации по этому каналу. Этот механизм возник очень давно, он был уже с вокализациями. Связан во многом с эмоциями и правым полушарием. Связки-эмоции-правое полушарие и подкорка (лимбика). Модулирование колебания связок – древнейший механизм выражения эмоций.

o Сюда же включается эстетика, красота речи.

o Индивидуальный стиль произношения.

o Медицинский аспект: при разных заболеваниях спектр речи изменяется определенным образом. Когда создается достаточно большой банк, по нему можно проводить автоматическую диагностику. И с некоторой вероятностью действительно угадывать болезнь. Потому что каждая из них определенным образом меняет гормональный фон.

o Возраст и пол.

o Статус. Чем выше статус, тем ниже интонирование.

«Наша психика – музей всех предыдущих форм поведения». Поскольку новые функции лучше осознаются, когда мы говорим, мы думаем, прежде всего, о смысле. Но актеры, например, вытягивают весь процесс порождения речи на сознательный уровень, чтобы сделать свою речь красивой и более понятной для зрителя.

Этология человека. В ней активно изучаются отношения полов. Исследование более сложной и простой речи. Девочка говорит с мальчиком более просто, чем говорила бы с девочкой. А мальчики – наоборот. Еще пример с политиками: на предвыборной кампании говорят очень просто, а как только выбрали – сразу очень сложно. Еще исследование – про мобильные телефоны. Чем больше мужчин в кафе, тем чаще они достают телефон и кладут его на стол. Вот так вот зоопсихологические моменты отражаются в реальном поведении.

Марков, «Эволюция человека»

Еще одна штука: на людей надевали халаты. Если ученого, то лучше решали задачи, если художника – то не лучше.

Эксперимент: в правое или левое ухо – короткие эмоциональные фразы. Просили оценить. Лучше расшифровываются те эмоциональные фразы, которые идут в правое полушарие (левое ухо). Чтобы показать, что левое полушарие больше настроена на техническую сторону речи, придумали дихотомическое прослушивание. Если у человека левое полушарие доминирует, он после окончания прослушивания вспоминает в основном те слова, которые слышал в правое ухо.

Но ни в коем случае не надо говорить, что левое полушарие делает только что-то одно, а правое – что-то другое. Они оба могут справиться со всем. Но что-то каждое делает лучше.

Викариат – межполушарный перенос функции при ее недостатке: когда ломается функция одно полушария, она симметрично отражается в другом.

Одна из гипотез о том, почему у левшей много проблем. Возможно, что у них полушария более симметричны в функциональном смысле, и получается конкуренция полушарий. Отсюда проблемы при принятии мозгом различных решений (на разных уровнях вплоть до самоубийств).

Коэффициент правого уха: 20%. Т.е. при вспоминании после дихотомического прослушивания на 20% большего количества слов можно сказать, что левое полушарие доминирует.

Пение. При пении связки колеблются с частотой гораздо больше, чем в обычной речи. Фонемы и смысл те же самые. Но весь спектр речи сдвигается направо. И изменяется эмоциональное наполнение. Пение включает древний экстралингвистический канал, связанный с эмоциями. Связочный язык эмоций один и тот же у всех народов во всех языках. Поэтому эмоции в песне на незнакомом языке в общем ясны.

Еще можно вычесть из спектра вокальной речи спектр обычной речи и посмотреть, что добавилось. Оказывается, есть специальная певческая форманта, которая добавляет в звук что-то вроде щелканья соловья.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: