Компьютерные технологии обработки речевых сообщений. Женило В.Р.

Начало - Фонограмма - След - Спектр - Речь - Фоноскопия - Вопросы

  Фиксация и отображение следов звука

  Неизменные компоненты следов звука

Проводить идентификационное исследование личности непосредственно по речевому сигналу практически невозможно. По этой причине некоторые юристы-процессуалисты, не вникая в природу речевых сигналов, могут сделать поспешный вывод о невозможности идентификации личности по речи, поскольку само базовое понятие криминалистики “след” оказывается весьма изменчивым. След, вроде бы, есть, но его форма в виде электрического сигнала всегда существенно отличается от оригинальной формы.

Действительно, звуковая волна в процессе своего распространения в воздухе, прохождения через системы преобразования в электромагнитную форму, линии передачи и звукозаписи может существенно изменять свой вид. И этот новый вид будет сильно отличаться от первоначального, имевшего место непосредственно вблизи губ говорящего в момент произнесения. Но это еще не означает, что искажается основная информация, которая первоначально присутствует в речевом сигнале. В большинстве случаев она остается неизменной. Исключение составляют случаи недопустимого (нелинейного) искажения сигнала аппаратурой звукопередачи или звукозаписи либо дополнительными шумами и помехами. Органы слуха человека извлекают из услышанного сигнала такие признаки, которые остаются неизменными практически при всех реально встречающихся искажениях речевых сигналов. Так же поступают и эксперты-фоноскописты.

На основе этих признаков строятся все системы анализа и обработки речевых сигналов, в том числе и системы идентификации личности по речевым сигналам: вместо анализа непосредственно акустической волны находятся признаки, неизменные (инвариантные) к тем преобразованиям и искажениям, которые всегда реально претерпевает речевой сигнал.

Эти признаки не придуманы искусственно человеком. Они реально присутствуют в окружающем нас мире. Описать их можно следующим образом.

Почти все звукопередающие, записывающие и воспроизводящие системы обладают одним очень важным свойством, которое называется линейностью системы. Важнейшим свойством любой линейной системы является передача ею гармонического сигнала (сигнала в виде синусоиды) с неизменной частотой, при возможном изменении амплитуды и фазы сигнала. То есть если на вход системы подается синусоида с определенной частотой (периодом), амплитудой и фазой, то на выходе системы будет тоже синусоида с точно такой же частотой, но, может быть, большей или меньшей амплитудой и другой фазой.

Большинство систем звукопередачи, записи и воспроизведения, с которыми мы обычно имеем дело, как правило, обладают этим свойством линейности (или очень незначительно отклоняются от этого свойства). И все описанные выше эксперименты проводились тоже на линейных системах. Поэтому если бы в эксперименте, отраженном на рис. 13, на вход системы мы подали бы не сложные сигналы (речь или импульс), а простую гармонику (синусоиду), показанную на рис. 14, то на выходе имели бы гармонику с точно такой же частотой, но другой амплитудой и фазой. То есть на всех трех рисунках (см. рис. 13) форма сигналов была бы одна и та же – гармоника. Все они имели бы одинаковую частоту (период), а вот амплитуда (размах) была бы разной. Разными были бы и их фазы – все они были бы по-разному сдвинуты чуть-чуть влево или вправо.


Рис. 14. Гармоника как базовый элемент любого сложного сигнала.

Далее. Известно, что любой сигнал может быть представлен в виде суммы большого числа отдельных гармоник (или микрогармоник) с разными частотами. А поскольку каждая из этих микрогармоник, проходя через любую (линейную) систему, не меняет своей частоты, то если какая-то совокупность микрогармоник была на входе, то эта же совокупность гармоник останется и на выходе системы. Единственно существенные изменения, которые происходят с микрогармониками в этом случае, проявляются в увеличении или уменьшении амплитуды. И при этом возможно небольшое смещение во времени каждой микрогармоники. А из-за того, что их амплитуды и фазы меняются незначительно (и меняются по-разному для разных частот), то форма результирующего сигнала на выходе системы всегда существенно отличается от его формы на входе системы. Что мы и видели на рис. 13.

Поняв этот механизм, становится ясно, на каком принципе строится работа систем “редактирования звука”. Эти системы раскладывают звук на элементарные “частицы” (микрогармоники) – элементы редактирования. Эти элементы можно выделять, удалять, копировать, переносить, создавать, вставлять и т.п. То есть выполнять все те стандартные операции, которые выполнимы в любом редакторе каких-то информационных данных.

Пример работы такого редактора приводится ниже. Но прежде, чем перейти к его описанию, следует пояснить еще несколько важных понятий, используемых в звуковых редакторах. Это понятия спектра и спектрального анализа.

Начало - Фонограмма - След - Спектр - Речь - Фоноскопия - Вопросы

Hosted by uCoz