Компьютерные технологии обработки речевых сообщений. Женило В.Р.

Начало - Фонограмма - След - Спектр - Речь - Фоноскопия - Вопросы

  Отражение в речевом сигнале звуков речи и голоса

  Анализ голосовых особенностей говорящего

Увидеть динамику следов голоса человека удобнее всего с помощью узкополосных сонофильмов. На рис. 29 показан узкополосный сонофильм фразы, произнесенной мужским голосом. На нем хорошо видны движущиеся по горизонтали полоски обертонов голоса, которые синхронно изменяются по высоте в зависимости от интонации высказывания.

Остановка высоты голоса (и всех его соответствующих обертонов) на некоторой высоте фактически означает, что голос “пропел” ту или иную ноту.

В обыденной речи у каждого человека есть свой диапазон изменения высоты голоса. Он довольно-таки индивидуален. По диапазону высоты голоса в музыке различаются голоса:

Измерив диапазон того или иного голоса, мы получаем информацию об индивидуальных особенностях голоса говорящего.

Но не только сам диапазон высоты голоса несет индивидуальную информацию. Статистически обрабатывая все значения высоты голоса, которые продуцирует тот или иной человек, получают множество других индивидуальных признаков голоса говорящего.

Для примера на рис. 34 показаны распределения высоты голоса двух мужчин с очень близкими средними значениями высоты голоса - 100,1 и 102,5 Гц. Если попытаться определить положение этих высот на нотном стане, то окажется, что они располагаются практически на одной ноте, но не точно, а в промежутке между нотами соль и соль-диез очень низкой октавы. Не всякий слушатель может заметить такое отличие средней высоты голоса на слух.


Рис. 34. Распределения высоты голоса двух мужчин с очень близкими средними значениями высоты голоса.

Помимо диапазона высоты голоса каждый голос имеет еще очень большое число признаков, которые отличают одни голоса от других. Остановимся только на тех из них, которые называются голосовыми доминантами.

Простой взгляд на контуры обертонов голоса на узкополосном сонофильме позволяет увидеть, что у одних лиц их контуры сильно изрезаны, в них превалируют участки резкого подъема, а участки звучания голоса с неизменной высотой практически отсутствуют. У другого лица, наоборот, контуры очень плавно меняют вид. В них могут непрерывно чередоваться подряд несколько подъемов, задержек на некоторой частоте и плавных спадов. У третьих лиц обнаруживается поразительное постоянство высоты голоса на всем протяжении длительного высказывания (очень монотонная речь). Поэтому у таких трех разных типов поведения высоты голоса его распределения, показанные для примера на рис. 34, будут разными.

Если строить распределения высоты голоса одного и того же человека, но в разных ситуациях, то эти распределения обычно отличаются друг от друга. Эти отличия несут в себе дополнительную информацию о влиянии дополнительных факторов: эмоциональном состоянии говорящего, с кем он говорит, на какую тему, в какой ситуации, в пьяном или трезвом виде, больном или здоровом состоянии и т.п. Но тем и оказываются полезны голосовые доминанты, что их положение в большинстве случаев остается устойчиво постоянным. Для примера на рис. 35 показаны два распределения высоты голоса одного и того же человека в эмоционально совершенно разных состояниях.



Рис. 35. Выборочная функция распределения высоты голоса одного и того же человека в разных эмоциональных состояниях.

Анализ этого явления показал, что решающий вклад в образование максимумов в распределении высоты голоса вносят устойчивые по высоте, относительно длительные участки траектории высоты голоса. Такие участки в обыденной речи встречаются довольно часто, и их длительность может варьироваться от 0,04 до 1 с и более (при заполнении речевой паузы звуками типа “Э-э”).

Такое свойство поведения высоты голоса в речи было обнаружено и описано довольно-таки давно. Так, в работе И.И. Левидова мы находим: “Слушая начинающего певца, педагог находит у него обычно, на ряду с неудовлетворительными, тускло и резко звучащими звуками, один или несколько уже более или менее хорошо звучащих. В то время как неблагополучные звуки производятся с резко выраженным усилием, обрываются, сопровождаясь гримасами, напряжением лица, шеи, а иногда и всего тела, тона, хорошо звучащие, издаются певцом относительно легко, без особого напряжения ... Эти, как я их назвал бы, основные звуки наименее поддаются дурным привычкам и навыкам, приобретаемым певцом-самоучкой. Если задать себе вопрос, на каких именно звуках диапазона можно у начинающего певца легче всего выявить наиболее приемлемые модификации звучания его голоса, то окажется, что таковыми в большинстве случаев являются два или три звука его диапазона, лежащие преимущественно в середине первой октавы его голоса - чаще всего те самые звуки, которые являются для него наиболее привычными в повседневной разговорной речи” (Левидов И.И. Певческий голос в здоровом и больном состоянии. – Л.-М.: Искусство, 1939. С.133).

Индивидуально не только распределение высоты голоса по нотам, но и характер естественной вибрации (дрожания) высоты голоса. По этому поводу приведем еще одну выдержку из работы И.И. Левидова: “Характер вибрации индивидуален у каждого голоса и в некоторой мере определяет его качество. Таким образом, вибрация может быть в известной степени рассматриваема даже как некий элемент тембра голоса. Характер вибрации определяется с детства и в неизмененном виде остается на всю жизнь” (Левидов И.И. Певческий голос в здоровом и больном состоянии. – Л.-М.: Искусство, 1939. С.181).

На динамику высоты голоса влияют не только все перечисленные факторы, но и сама речь. А именно, во время говорения речевой тракт то несколько прикрывается, то приоткрывается, в зависимости от порядка произносимых звуков. В эти моменты происходят изменения тока струи воздуха, что приводит к маленьким скачкам высоты звучания голоса. Определить их на слух (точнее – описать) может далеко не каждый, хотя каждый их слышит и таким образом отличает собеседника по голосу, даже в случае сильнейшего искажения речи, например по телефону. Но это можно сделать с высокой точностью и надежностью с помощью специальных компьютерных программ. Так, на рис. 36 в качестве примера приведены графические образы, отражающие динамику высоты голоса тех же лиц и на том же слове “алло”, что и на рис. 31, 32, 33.


Рис. 36. Интонограммы слова “алло” разных лиц.

На рис. 36 горизонтальная ось соответствует времени, а вертикальная – высоте голоса. Серые относительно короткие линии – это траектории высоты голоса. Причем чем темнее линия, тем чище звучание голос, а чем серее – наоборот.

Начало - Фонограмма - След - Спектр - Речь - Фоноскопия - Вопросы

Hosted by uCoz