Краткая история фоноскопических технологий

Прежде, чем приступить к изложению самых ярких страниц истории фоноскопических технологий, следовало бы сначала уточнить несколько ключевых понятий, которые будут затронуты в этом учебном курсе.

Под технологией мы будем понимать совокупность средств и методов для достижения той или иной цели. А поскольку средства могут быть материальными и идеальными, то отдельно следовало бы рассмотреть аппаратные средства и программные средства.

Предыдущее утверждение всего лишь 20-30 лет назад могло показаться кощунственным. Однако очень быстрое развитие цифровых информационных технологий показало, что не только аппаратная часть компьютера является важнейшей составной компонентой любого современного компьютера, но не менее важным в компьютерных технологиях является его идеальная – программная часть.

Если раньше все электроакустические исследования проводились только с помощью аналоговой аппаратуры, то акцент на разделении понятий hardware и software вообще не возникал. То теперь он не только возник, но и значительно сместился в сторону программного обеспечения. Для современных фоноскопических исследований уже не столь критическим является аппаратная часть измерительно-вычислительного комплекса, как это было раньше. Современные компьютеры с многоядерными процессорами позволяют проводить вычисления и анализ огромных массивов данных практически любой сложности. И для нужд фоноскопии уже сейчас существует много моделей современной вычислительной техники, которые могут удовлетворить самые смелые планы исследователей звуковых, в том числе, речевых сигналов. А вот, как сейчас модно говорить, «интеллектуализированных» программных средств по-прежнему очень не хватает. Почему – об этом будет сказано в соответствующем разделе курса.

Это смещение интересов фоноскопии в сторону идеальной (информационной) части исследований привело, в частности, и к тому, большее внимание стало уделяться не средствам и методам работы со звукозаписывающими и воспроизводящими устройствами, а средствам и методам анализа речевых сигналов. Хотя, справедливости ради, следует подчеркнуть, что от технологии звукозаписи и воспроизведения в решающей мере зависит результат любого фоноскопического исследования.

Поэтому в дальнейшем изложении будет встречаться такой термин, как фонообъект, что в действительности обозначает следующее. Фонообъект – это некоторый реальный объект или явление, следы которого могут оставаться на фонограмме во время звукозаписи.

А фонограмма – это материальный носитель информации, на котором зафиксированы следы звука. Вопрос о том, что такое информация будет рассмотрен в отдельной главе курса. Так же как и технологии фиксации следов звука.

Если остановиться только на криминалистической части истории развития технологий фоноскопических исследований, то в этой части можно рекомендовать самостоятельно прочитать основные научные труды следующих ученых: Г. Фант, Дж. Фланаган, Г.С. Рамишвили, В.Н. Сорокин, А.А. Пирогов и В.Л. Шаршунский.

Здесь же мы отметим неоднозначность взглядов на криминалистическую фоноскопию, которые проявляются в разных научных и практических средах. В этой части можно сказать так – сколько существует разных специалистов, столько существует и разных убеждений и мнений о том, что может, а что не может современная криминалистическая фоноскопия.

Мнение юристов в 60-тые годы прошлого века было очень категоричным. Производить идентификацию личности по магнитным фонограмма нельзя из-за того, что в то время не было достаточно точных приборов для обнаружения следов возможного монтажа фонограмм. Это продемонстрировали научные сотрудники одного из институтов специальной техники, сделав такой монтаж магнитной фонограммы, который не обнаруживался ни на слух, ни с помощью имевшихся в то время аппаратных средств.

Но ситуация резко изменилась, когда первопроходцы криминалистической фоноскопии в те же годы показали, что с помощью уникального в то время прибора - сонографа – следы любого, даже самого изысканного в то время монтажа фонограмм, можно было обнаружить аппаратными средствами.

Эта история полувековой давности повторилась в наши дни, когда вся звукозапись перешла на цифровую основу. Снова появились во многом справедливые утверждения, что цифровую фонограмму нельзя использовать в судебном процессе только лишь из-за того, что якобы можно сделать такой компьютерный монтаж фонограммы, что никаких его следов не останется. Но как показывает практика, возможность обнаружения монтажа в большей мере определяется не спецификой цифровой фонограммы, а уровнями квалификации того, кто делает монтаж, и того эксперта, кто его обнаруживает. Вот почему вопрос квалификации эксперта фоноскописта всегда был и остаётся решающим в этой области.

Если аналогичный вопрос задать физику или электроакустику: «А можно ли идентифицировать личности по его речевому сигналу», - то можно услышать такой уклончивый ответ: «В природе речевого сигнала нет ни одного параметра, который бы не удалось сейчас измерить с практически любой наперед заданной точностью». И это совершенно справедливо. Современные методы цифровой обработки и анализа звуковых сигналов позволяют измерить даже такие параметры речевых сигналов, которые ранее невозможно было измерить с помощью даже самой лучшей измерительной аналоговой электроакустической техники. Но за этим уклончивым ответом скрывается другая принципиально сложная проблема. Дело в том, что речевой сигнал – это не след какой-то механической или детерминированной системы. Это след интеллектуальной системы. И этот след надёжно может распознать лишь интеллектуальная система такого же или более высокого уровня. А те программные средства, которые сейчас задействованы в компьютерных системах, никаким интеллектом не обладают (как бы производители не эксплуатировали очень модный сейчас термин «smart device»). Но этот вопрос более детально будет рассмотрен в отдельной главе учебного курса.

Если тот же вопрос задать лингвистам, то обычно можно услышать утвердительный ответ: «Да, идентифицировать личность по его речевому сигналу можно потому, что …», - и далее идет длинный перечень возможных лингвистических признаков устной речи, в которых могут хорошо проявляются индивидуальные особенности говорящего. Но при этом умалчивается, что, на самом-то деле, эксперт лингвист успешно зачастую решает эту задачу потому, что технология идентификации говорящего становится не алгоритмической, а интеллектуальной. И чем выше интеллект и опыт эксперта лингвиста, тем вероятнее, что он не ошибётся в решении задачи идентификации личности по речевому сигналу. В этом сила эксперта лингвиста, но в этом и его слабость. Слабость заключается в том, что не всегда, то, что улавливает высокоинтеллектуальный слух эксперта лингвиста, можно чётко и объективно показать в виде каких-то визуальных образов, что очень важно в суде, или в виде перечня признаков, которые может подтвердить другой эксперт лингвист в случае назначения повторной экспертизы. Другими словами, интеллект и субъективизм иногда может сыграть злую шутку в виде слуховых иллюзий. Поэтому в лингвистической среде даже имеется понятие - фонематический слух, аналогично тому как в среде музыкантов имеется понятие – музыкальный слух.

Задав тот же вопрос экспертам криминалистам, можно услышать не всегда совпадающие варианты ответов. Криминалисты теоретики чётко отвечают: «Нет проблем. Используйте общую теорию криминалистической идентификации, где описаны основные этапы экспертиз – раздельного исследования, сравнительного исследования и принятия решения – и правильно используйте такие ключевые понятия как общие и частные индивидуальные признаки. И тогда вы сможете не только идентифицировать, например, огнестрельное оружие по выпущенной из него пуле, но и художника по его манере письма картин».

Эксперты практики в этом вопросе обычно не столь категоричны (особенно те эксперты фоноскописты, которые уже много лет проработали в этой области). Поэтому опытный эксперт всегда предпочтёт проводить такие экспертизы не в одиночку, а комиссионно, с привлечением к исследованию специалистов разных областей знаний: юриспруденции, лингвистики, акустики, электроакустики, цифровых информационных технологий, а иногда и физиологов и психологов.

Если познакомиться с мнением адвокатов на возможность проведения фоноскопических экспертиз, то они зачастую акцентируют внимание на том, что применяемая в процессе звукозаписи и исследования аппаратура чаще всего не прошла метрологическую поверку и не сертифицирована. А к применяемым методикам идентификации личности по речевому сигналу обычно претензии не предъявляются, особенно если эти методики рассмотрены и утверждены соответствующими научно-производственными подразделениями правоохранительных органов.

Судьи, как обычно, в подобных вопросах полагаются и учитывают мнения экспертов разных противоборствующих сторон состязательного уголовного процесса.

Переходя к изложению самых ярких страниц истории развития фоноскопических исследования, следует отметить, что она также не совсем простая, как может показаться или как можно было бы ожидать. Хороших книг на эту тему найти, пока что, не удаётся. И для начала можно было бы рекомендовать три книги:

· Ложкевич А.А., Снетков В.А.,Чиванов В.А., Шаршунский В.Л. Основы экспертного криминалистического исследования магнитных фонограмм / Под общ. ред. В.А.Снеткова.- М.: ВНИИ МВД СССР, 1977;

· Рамишвили Г.С., Чикоидзе Г.Б. Криминалистическое исследование фонограмм речи и идентификация личности говорящего. - Тбилиси: Мецниереба, 1991;

· Hollien H. The acoustics of crime: the new science of forensic phonetics. - New York and London: University of Florida, Plenum Press, 1990.

Последний автор в этом списке, являясь лингвистом по образованию, написал очень хорошую книгу, которая могла бы стать настольной книгой даже современного эксперта фоноскописта. Эту свою книгу он, как и многие другие авторы, начинает с рассмотрения исторического вопроса – когда и кем впервые применялись фоноскопические технологии, в частности, для идентификации личности по устной речи.

Однако, установить “дату рождения” криминалистической фоноскопии так же невозможно, как и решить подобный вопрос о времени рождения и авторстве любого другого ярко выраженного направления в науке, технике, медицине или в культуре в целом. Часто популяризация и широкое распространение ранее малоизвестных научных данных многими воспринимаются как открытие, причем авторство зачастую приписывается лицу, обнародовавшему эти данные. Но ни одно научное открытие или разработка не происходят в одиночку. Созревание нового в культуре общества длится дольше жизни одного человека. Любой выдающийся ученый, изобретатель или исследователь теснейшим образом связан со своими коллегами, живущими не только в его время, но творившими задолго до него. И неожиданное появление новой идеи, задумки или решения объясняется активностью и разнообразием культурных связей (в широком смысле) между учеными во все времена. В этом плане мир ученых можно сравнить с мозгом человека, в котором постоянно идет обмен информацией между отдельными клетками. И благодаря этому широкому обмену образуется нечто загадочное, называемое нами интеллектом.

Знакомство с публикациями по вопросам истории фоноскопии вообще и криминалистической в частности показывает, что разные авторы по-своему видят корни ее развития. Почему-то чаще всего их связывают с некоторыми значимыми политическими событиями, а не с разработкой научных, технических, методологических и иных основ, фактически дающих возможность реального решения фоноскопических проблем в той или иной общественной ситуации.

И таким наиболее ярким примером в этом отношении является взгляд на историю криминалистической фоноскопии, изложенный в указанной монографии Hollien H. В ней, пытаясь определить лидерство в новой молодой отрасли - криминалистической фоноскопии, автор сначала с иронией упоминает историю жизни фоноскопической лаборатории, описанную в романе А.И.Солженицына “В круге первом”. При этом Hollien H. затрагивает лишь больные политические проблемы и совершенно не останавливается на сути вопросов криминалистической фоноскопии. Затем, демонстрируя большой временной разрыв, автор указывает на то, что следы первого обсуждения допустимости применения “аурально-перцептивного” (т.е. на слух) свидетельского показания уходят на несколько столетий назад в Англию, где в ещё аж 1660 г. рассматривалось дело некого Вильяма Хьюлета. Реально же свидетельские показания об идентичности речи и голоса стали приниматься судами США и Великобритании наравне с другими уликами, начиная с 1907 г.

Неосведомленному читателю может показаться, что идентификация личности по устной речи решалась уже давно, и если учесть современные научно-технические достижения, то никаких сомнений в разрешимости этого вопроса вообще быть не может. Но несмотря на историческую достоверность отмеченных событий, действительно научного решения вопроса не было в обоих упомянутых случаях. Следует признать, что и в настоящее время в проблеме идентификации личности по речи больше вопросов, чем достоверных ответов. Интуитивно большинство специалистов и обывателей чувствуют, что проблема идентификации личности по устной речи имеет положительное решение, но привести бесспорное доказательство в полном объеме и тем более предложить надежную и безупречную процедуру (методику, алгоритм) идентификации личности по речи еще никому не удалось.

Основная задача криминалистической фоноскопии традиционно рассматривалась как идентификация личности по устной речи. Речь и голос человека так же, как и почерк, настолько индивидуальны, что даже у неспециалистов возможность такой идентификации обычно не вызывает сомнения. Объясняется это тем, что идентификация личности по голосу и речи повседневно осуществляется каждым. Однако если почерковедение заняло в криминалистике твердое положение, то фоноскопические исследования долго не могли окончательно определиться. Причина здесь, видимо, кроется в том, что фоноскопия по сравнению с идентификацией личности по письменной речи существенно более разноплановая. И поэтому сколько специалистов разных отраслей знаний - столько и мнений. Однако в отличие от письменной речи, которая является объектом исследования двух видов криминалистических экспертиз - почерковедческой и автороведческой, устная речь является, по крайней мере, объектом трех видов исследований - артикуляционного, голосового и автороведческого. Первые два исследования так и не получили своего четкого названия, что характеризует сложность криминалистической фоноскопии, которая очень трудно строго разделить по предметам исследования, как в письменной речи. Поэтому фоноскопия обычно занимается сразу всем - идентификацией личности и по артикуляции, и по голосу, и по тексту, идентификацией магнитофонов, исследованием признаков монтажа или копирования фонограмм и др.

Если следовать логике разграничения понятий, принятой в почерковедении и автороведении, то задачу идентификации личности по устной речи можно разделить на идентификацию по речевому сигналу и по тексту. Исходя из сказанного, правильнее всего было бы определить основную задачу идентификационного исследования личности в фоноскопии как идентификацию личности по речевому сигналу.

В свою очередь, поскольку сам речевой сигнал отражает две относительно самостоятельные группы индивидуальных признаков, то их можно было бы разделить на артикуляционные и голосовые. Поэтому можно говорить о двух задачах: идентификации личности по артикуляции и по голосу.

Если сравнить уровень современного развития почерковедческих криминалистических исследований и фоноскопических, то явное превосходство оказывается у первых. Произошло это, по-видимому, потому, что рукописные тексты и подписи издревле применялись как вещественные доказательства того или иного факта, и общество уже давно приняло эту бумажную форму информационной технологии. А новая безбумажная технология, к каковой относится и звукозапись, хотя и пробила себе дорогу, но еще находится в стадии бурного развития.

Предметно и более объективно об идентификации личности по речевому сигналу начали говорить лишь в середине двадцатого столетия, когда магнитофон стал применяться сначала в военных целях, а затем и во всех сферах информационной деятельности человека.

Первые попытки идентификации по речевому сигналу строились на лингвистическом анализе речи. Они, как правило, были обречены на неудачу, поскольку в юриспруденции очень силен древневосточный принцип: от лжи (уха) - до истины (глаза) - пять пальцев. А поскольку средств объективного анализа речи практически не было и, соответственно, не было методик идентификации, то в последние десятилетия получили распространение толкования уголовно-процессуальных норм, попросту запрещающих применение следов речи на магнитной фонограмме для идентификации личности. Эти запреты коснулись не только судебной практики, но и существенно тормозили все научные исследования в области фоноскопии. Однако, несмотря на препоны фоноскопия развивалась и продолжает развиваться, базируясь при этом на надежном научном фундаменте, имеющем длинную историю.

Основы акустической теории речеобразования были заложены Гельмгольцем Германом Людвигом Фердинандом (1821-1894 гг.) - немецким ученым, автором фундаментальных трудов по физике, биофизике, физиологии и психологии.

Фото 1 и 2. Герман Людвиг Фердинанд фон Гельмгольц (нем. Hermann von Helmholtz; 31 августа 1821, Потсдам — 8 сентября 1894, Шарлоттенбург) — немецкий физик, физиолог и психолог. В Москве именем Гельмгольца названо НИИ Глазных болезней на Садово-Черногрязской улице.

Гельмгольц впервые раскрыл природу формирования гласных звуков и вывел основные уравнения взаимосвязи геометрии объемных полых фигур и их резонансных частот. Этот первый теоретический шаг в освоении речевой технологии сразу же породил попытку создать механическую говорящую машину. Для этого предлагалась сложная система акустических резонаторов, которая управлялась специальным механизмом примерно так же, как это делает человек. Однако реализовать эту идею до конца не удалось.

Познакомиться с биографией Германа Гельмгольца можно здесь:
http://to-name.ru/biography/german-gelmgolc.htm
http://www.krugosvet.ru/enc/gumanitarnye_nauki/psihologiya_i_pedagogika/GELMGOLTS_GERMAN_LYUDVIG_FERDINAND.html
http://www.physchem.chimfak.rsu.ru/Source/History/Persones/Helmholtz.html
http://www.psychology-online.net/articles/doc-636.html

Вторым важным историческим шагом в освоении речевой технологии было изобретение механического устройства записи звука. Вопрос о том, кто первым изобрёл это устройство, обычно освещается по-разному. На всякого рода публичных развлекательных шоу и викторинах участникам и зрителям обычно предлагают только один, более-менее, правильный вариант ответа на этот вопрос – Томас Эдисон. А имя французского любителя Шарля Кро, который ранее Эдисона предложил механическое устройство для записи звука, даже не упоминается в перечне возможных (но неправильных) вариантов ответа на вопрос викторины. В некотором смысле этому есть оправдание. Поскольку правильный ответ – Шарль Кро – не может фигурировать в категории «неправильных ответов».

Чтобы разобраться в этом щекотливом вопросе, следует внимательно разобраться в истории рождения и развития технологий звукозаписи. Эта история очень напоминает историю изобретения радио - кто первым был в этом деле - А.С.Попов, А.Маркони или Н.Тесла?

«Создателем первой успешной системы обмена информацией с помощью радиоволн (радиотелеграфии) в некоторых странах считался итальянский инженер Гульельмо Маркони (1896). Однако у Маркони, как и у большинства авторов крупных изобретений, были предшественники. В России «изобретателем радио» считается А. С. Попов, создавший в 1895 г. практичный радиоприёмник. В США таковым считается Никола Тесла, запатентовавший в 1893 году радиопередатчик, а в 1895 г. приёмник; его приоритет перед Маркони был признан в судебном порядке в 1943 году. Во Франции изобретателем беспроволочной телеграфии долгое время считался создатель когерера (трубки Бранли) (1890) Эдуард Бранли. В Англии, в 1894 году первым демонстрирует радиопередачу и радиоприём на расстояние 40 метров изобретатель когерера (трубка Бранли со встряхивателем) Оливер Джозеф Лодж. Первым же изобретателем способов передачи и приёма электромагнитных волн (которые длительное время назывались «Волнами Герца — Hertzian Waves»), является сам их первооткрыватель, немецкий учёный Генрих Герц (1888)».[1]

Фото 3. Герц Генрих Рудольф (нем. Heinrich Rudolf Hertz, 22 февраля 1857 года – 1 января 1894 года).

Это лишь весьма краткое изложение основных вех изобретения радио. На том же сайте, откуда взята приведенная выше цитата, имеется более детальное изложение истории изобретения радио. И эта история начинается в 1866, а заканчивается в 1935 году.

До недавнего времени считалось, что история начала развития звукозаписи задержалась на десять лет по сравнению с началом истории развития радио.

Первым изобретателем механического устройства записи звука считается французский поэт и изобретатель Шарль Кро (фото. 4).

Фото. 4. Шарль Кро (фр. Charles Cros; 1 октября 1842, Фабрезан — 9 августа 1888, Париж, Франция).

Он 30 апреля 1877 г. послал во Французскую Академию наук свое изобретение, названное им “фонограф”, которое позволяло механически записывать звук на вращающийся стеклянный диск, покрытый сажей, а затем фотоспособом переносить звуковые дорожки на светочувствительную хромовую пластинку. В декабре 1877 г. американский изобретатель Томас Эдисон (фото. 5) продемонстрировал свой фонограф в действии, в котором звук записывался на обернутый в оловянную фольгу цилиндр.

Фото. 5. То́мас А́лва Э́дисон (англ. Thomas Alva Edison; 11 февраля 1847 — 18 октября 1931).

Голос Эдисона – одна из первых фонограмм, записанных на фонографе Эдисона.

Отступление.
Подарок Льву Николаевичу Толстому от Эдисона:
http://www.rian.ru/society/20080226/100056926.html
Фонограммы речи Льва Николаевича Толстого, записанные с помощью фонографа Эдисона:
- «Об искусстве»;
- «Обращение к мальчикам»;
- «Письмо к С.А. Стахович»;
- «Не могу молчать», вариант статьи;
- «Волк», сказка ;
- «На каждый день», из книги.

Через 10 лет, в 1887 г., немецкий изобретатель Эмиль Берлинер (фото. 6) запатентовал фонограф, в котором он видоизменил идею Шарля Кро - запись звука производится на цинковом диске, покрытом тонким слоем воска, а тиражирование осуществляется химическим травлением.

Фото. 6. Эмиль Берлинер (англ. Emile Berliner; 20 мая 1851, Ганновер — 3 августа 1929, Вашингтон).

«В 1887 году Берлинер запатентовал новое устройство — граммофон. В 1895 году основал Berliner Gramophone — первую компанию, занимавшуюся продажей граммофонных записей. Через два года открыл филиал в Великобритании — Gramophone Company (в настоящее время EMI — одна из крупнейших звукозаписывающих компаний мира), ещё через год — в Германии (Deutsche Grammophon)»[2].

Таким образом, основная часть истории развития механической записи звука уложилась в 10 лет. Но современные историки звукозаписи недавно нашли интересный носитель звука, который был изготовлен задолго до изобретений Шарля Кро, Томаса Эдисона и Эмиля Берлинера - в 1860 году. Но он принципиально отличался от изобретений перечисленных авторов тем, что извлечь звук из этого носителя ранее было невозможно. Это удалось сделать только сейчас с помощью современной цифровой информационной технологии. Об этом сообщила газета «The New York Times», поместив в своём номере от 27 марта 2008 года статью Джоди Росена (Jody Rosen) «Исследователи воспроизвели песню, записанную до Эдисона» («Researchers Play Tune Recorded Before Edison»). В этой статье рассказывается о том, что уже более века считается, что отцом звукозаписи является Эдисон. Однако недавно ученые воспроизвели записанную механическим способом на бумаге 10-тисекундную фонограмму, изготовленную 9 апреля 1860 года парижским наборщиком текстов Эдвард-Лоен Скоттом дэ Мартинвил (Édouard-Léon Scott de Martinville).

Послушать эту фонограмму можно на сайте газеты[3]. А внешний вид этой исторической находки - самой ранней известной регистрации звука – см. на фото. 7.

Фото. 7. Историк David Giovannoni с самой ранней (1860 г.) фонограммой пения.

Для криминалистических целей описанные изобретения фонографов практической ценности не имели из-за очень сложной технологии звукозаписи. По этой же причине практически не применялись оптические фонограммы, которые дали звук немым кинофильмам. А вот магнитные фонограммы послужили мощным толчком в развитии криминалистической фоноскопии. И следует отметить, что не только магнитные ленты встречались (и встречаются) в экспертной практике. Но и магнитные записи на стальной проволоке встречались в экспертной практике всего лишь 20 лет назад.

«Принцип магнитной записи на стальную проволоку был предложен Вальдемаром Поульсеном (Дания) в 1896 г. Сам аппарат изобретатель назвал «телеграфоном». Магнитная лента (сначала на бумажной основе) была предложена в начале 20-х гг. XX века. Тогда же Шюллером (Германия) была предложена классическая конструкция кольцевой магнитной головки, представлявшей собой кольцевой магнитный сердечник с обмоткой на одной стороне и зазором на другой. При записи в обмотку подаётся ток записи, вызывающий выход магнитного поля в зазоре, который намагничивает магнитную ленту в такт изменению сигнала. При считывании, наоборот, лента, замыкая магнитный поток через зазор на сердечник, наводит ЭДС в обмотке.

Принцип высокочастотного подмагничивания — подмешивания в записываемый сигнал высокочастотной составляющей — был предложен в начале 30-х гг. Браунмюлем и Вебером, усовершенствован в конце 30-х гг. Нагаи, Карпентером и др.

В 30—40-х гг. XX века получили развитие бобинные магнитофоны, причём имелись уже и портативные модели, с конца 50-х гг. — картриджные, а с конца 60-х гг. — кассетные. Цифровые магнитофоны появились в конце 70-х гг.»[4].

С появлением сначала механических средств звукозаписи - фонографов, а затем и электромагнитных - магнитофонов исследователи получили возможность многократно и разносторонне исследовать одни и те же речевые сигналы, зафиксированные на фонограмме. Это событие родило волну новых исследований речи, но они, как правило, базировались на аудитивном анализе, что, как уже отмечалось, несет большой отпечаток субъективности.

Ключевым этапом развития фоноскопии вообще (не только криминалистической) стало изобретение прибора, позволившего не только многократно воспроизводить один и тот же речевой сигнал, но и увидеть его преобразованную форму, ярко отражающую артикуляционные и голосовые особенности говорящего. Зарождался этот прибор долго. В течение 20-30-х годов нашего столетия во время известного оживления в научном мире предлагалась масса вариантов визуализации речевых сигналов. После долгих испытаний и отбора лучшего способа к концу второй мировой войны наконец-то был разработан прибор, факт существования которого долго хранился в тайне в силу его большого военного значения. Лишь 9 ноября 1945 г. в еженедельном журнале “Science” в статье “Видимые образы звука” Ральф Поттер[5] впервые приоткрыл завесу секретности над новым инструментом, разработанным сотрудниками фирмы “Bell Telephone Laboratories”[6]. Сначала его назвали звуковым спектрографом, но позже за ним закрепилось другое название - сонограф.

Появление сонографа, позволившего увидеть одновременно и артикуляционные, и голосовые особенности говорящего, уже к 1944 г. породило скороспелые прожекты полного решения проблемы идентификации личности по речевому сигналу. Позже даже появился долго остававшийся модным термин “voiceprint” - “отпечаток голоса” (по аналогии с термином “fingerprint” - “отпечаток пальца”), который обозначал всего лишь один из видов узкополосных сонограмм речевых сигналов, внешне очень напоминающих отпечатки пальцев.

Такое “удачное” терминологическое определение нового понятия сыграло своеобразную роль в дальнейшем развитии криминалистической фоноскопии. Поскольку в то время дактилоскопия была вне критики, это послужило как бы подменой прямого доказательства возможности идентификации личности по речевому сигналу. Однако терминологическая неточность сыграла крайне негативную роль в научном решении проблемы, поскольку администраторы от науки считали, что фоноскопическая проблема исчерпана, и поэтому прилагать какие-то усилия в этом направлении нет необходимости. Это, в конечном итоге, привело к тому, что научная обоснованность и убедительность выводов экспертов-фоноскопистов зачастую были, мягко говоря, не на должном уровне, и, как следствие, со временем развился обратный процесс недоверия фоноскопической экспертизе.

Прежде чем фоноскопия превратилась в серьезную науку, ей пришлось пройти еще две стадии развития (научно-теоретическую и инструментально-методологическую), прежде чем удалось обеспечить эксперта минимально необходимой технологией исследования речевых сигналов.

Решающий вклад в это развитие внесло не одно поколение выдающихся ученых: Г.Фант, Дж.Фланаган, А.А.Пирогов, В.Н.Сорокин, И.Максимов, В.П.Морозов, С.А.Гельфанд, Р.Юссон, А.В.Оппенгейм, Р.В.Шафер, Л.Р.Рабинер, Дж.Маркел, А.Грей, Р.Отнес, Л.Эноксон, В.Н.Трунин-Донской, Р.К.Потапова, Г.С.Рамишвили, Ю.И.Прохоров, В.И.Галунов, Н.Г.Загоруйко, Х.Холлиен, Т.К.Винцюк, М.А.Сапожков и многие другие. Это выдающиеся теоретики и практики широкого профиля. Среди ученых, тесно занимавшихся проблемами идентификации личности по речи и внесших огромный вклад в их решение, следует упомянуть: Б.Атала, Дж.Доддингтона, Е.Бунге, В.Д.Сердюкова, М.А.Тушишвили, Г.Б.Чикоидзе, А.Розенберга, В.Л.Шаршунского, Ю.Ф.Жарикова и многих других. Юридические проблемы криминалистической фоноскопии лучше всего исследованы в работах таких ученых, как В.А.Снетков, Э.К.Ребгун, А.А.Леви, Ю.А.Горинов и другие.

После первых попыток, предпринятых во время войны, и провала надежд на простое решение проблемы идентификации личности по речи, внимание ведущих ученых было уделено объяснению природы речеобразования. В этой сфере были развернуты фундаментальные исследования, которые к концу 5О-х годов позволили Г.Фанту в тесном сотрудничестве с Акустической лабораторией Массачусетского технологического института создать акустическую теорию речеобразования. Переход от артикуляционного описания речи, принятого в лингвистике, к акустическим методам и создание прочной теоретической базы возродили исследования индивидуальных признаков речи.

В начале 6О-х годов Г.С.Рамишвили начал системные исследования индивидуальных признаков речи и голоса, привлекая для этих целей аудиторные, экспертные и все доступные инструментальные методы анализа речевых сигналов. Были установлены акустические параметры речевых сигналов, отражающие те или иные индивидуальные особенности речеобразования, оценены их информативность и надежность определения[7].

В это же время за рубежом Керст предпринял новую попытку разработать методику идентификации личности по сонограммам речевого сигнала. Было заявлено, что его методика позволяет считать проблему идентификации личности по речи полностью решенной. Несмотря на то, что идентификационные исследования по сонограммам носили все же более качественный и субъективный характер, за что не раз и обоснованно подвергались жесткой критике, эта методика все же нашла свое применение в криминалистической практике некоторых стран. Основная причина тому - легкость получения сонограмм при отсутствии иных технологически простых способов исследования речевых сигналов. Однако простота получения сонограмм с “отпечатками голоса” далеко не решила всех проблем идентификации в криминалистике. Поэтому, относясь критично к новому и еще далеко не совершенному виду криминалистических исследований, Международная ассоциация по идентификации (IAI - International Association of Identification) потребовала специальной подготовки экспертов-криминалистов по теоретической и практической части идентификации с обязательной сдачей экзамена для получения удостоверения на право производства фоноскопических экспертиз[8]. В 1975-1977 гг. эта методика подверглась жесткой критике со стороны ведущих ученых и специалистов в области речевой технологии[9].

В эти же годы появляется ряд работ, посвященных поиску индивидуальных признаков речевых сигналов. В работах ведущих ученых (Б.Атал, Г.С.Рамишвили, М.А.Тушишвили, Е.Бунге, А.Розенберг, Дж.Доддингтон и другие) приводились новые данные об отражении индивидуальных особенностей говорящего в его речевом сигнале.

После небольшого затишья в рекламной шумихе о всемогуществе ФБР в сфере речевой технологии в середине 80-х годов снова стали появляться сообщения об их “превосходных” достижениях в области идентификации личности по речи. Так, в авторитетнейшем акустическом научном журнале “The Journale of the Acoustic Society of America” появилась статья[10], в которой сообщалось о блестящих показателях работы ФБР по идентификации личности по речи. В ней указывалось, что ошибки идентификации первого рода (исключение тождества голосов одного и того же лица) составляют О,53%, а ошибки второго рода (отождествление голосов разных лиц) - О,31%.

С научной точки зрения, это были бы действительно очень высокие показатели надежности идентификации. Однако ведущим специалистам по речи они показались слишком уж хорошими, после чего в том же журнале[11] ими была опубликована статья о нереальности таких показателей. Критика была настолько убедительна, что авторам из ФБР пришлось поместить в журнале ответную статью[12] с пояснением того, что они в действительности имели в виду. Оказалось, что это не реальные показатели надежности системы идентификации в среднем по разным исследованиям, а показатели применительно к “очевидным случаям”. В остальных же случаях (которых оказалось большинство) эксперты обычно давали ответы типа: “материал не пригоден для исследования” или “ответить на вопрос не представляется возможным”.

В некоторых критических публикациях указывается на уязвимость методики идентификации личности по “отпечатку голоса” в основном по следующим причинам:

а) в методике не сформулированы четкие критерии сопоставления речевых образов, представляемых на сонограммах;

б) из-за отсутствия привязки исследуемых признаков речевого сигнала, проявляемых на сонограммах, к природе речеобразования слабо аргументированы выводы об идентичности личности;

в) заранее не определено, какие признаки, проявляемые на сонограмме, отражают (или в принципе могут отражать) индивидуальные особенности речевого сигнала.

Эти критические замечания по сути своей не отрицают возможности идентификации личности по сонограммам, но они требуют более строгого научного решения задачи с учетом всех факторов, влияющих на получаемый в реальности образ речевого сигнала. При этом указывается на необходимость учета влияния линейных и нелинейных аппаратурных искажений речи в процессе ее записи на магнитные носители, психологической ситуации, вида текста, эмоционального состояния говорящего, акустических условий, шумов и помех и прочих факторов, вносящих вклад в вариативность речевого сигнала.

С внедрением измерительно-вычислительной техники и развитием цифровых методов обработки и анализа сигналов стало возможным проводить уже не только амплитудно-частотно-временной анализ, как это делается с помощью сонограмм, но и с высокой точностью измерять целые комплексы практически всех известных акустических параметров речевого сигнала. Исследования проблем опознавания личности по речи значительно расширились. Цифровые методы обработки сигналов полностью сняли ограничения на перечень анализируемых акустических параметров. Появились возможности оценивать индивидуальные особенности строения и функционирования отдельных звеньев органов речи, основываясь на акустической теории речеобразования. Это сняло многие критические замечания, относящиеся к методике идентификации личности по “отпечаткам голоса”.

Современные возможности цифрового анализа сигналов в сочетании с достижениями в области фониатрии, речевой акустики и смежных отраслей знаний делают проблему опознавания говорящего принципиально разрешимой. Но, несмотря на это, следует признать, что единой универсальной методики опознавания по речи еще нет. Скорее всего такая универсальная методика и не будет разрабатываться, поскольку практических задач существует очень много, и каждая из них выдвигает свои требования к характеристикам системы опознавания.

Трудно перечислить все факторы, вызывающие изменение голоса человека в речи. По этим изменениям мы определяем, спрашивает или отвечает собеседник, находится ли он в хорошем настроении или чем-то подавлен, здоров или болен, возбужден или находится в нормальном состоянии и т.п. Все это в той или иной мере находит свое отражение в голосе во время разговора. Но даже при такой широкой вариативности голоса мы все равно узнаем говорящего, не видя его. Более того, можем узнавать его голос, не разбирая не только смысла, но и текста высказывания. Понять, каким образом нам это удается, - значит найти путь решения криминалистической задачи опознавания личности по голосу. Пока эта задача еще очень далека от своего полного решения, хотя многие индивидуальные признаки речи известны и используются в экспертной практике.

С акустической точки зрения, речевой сигнал поддается разбиению на четыре группы участков[13], различающихся по характеру источника звука: пауза, голосовой, шумовой и голосовой в совокупности с шумовым источники звука. Такая классификация не является вполне адекватной и требует введения дополнительных групп: импульсных источников, импульсных с голосовым источником и др. Однако она оказалась удобной для проведения первых фундаментальных акустических исследований и развития акустической теории речеобразования.

Для криминалистических исследований более удобна упрощенная классификация участков речевых сигналов, включающая в себя три группы интервалов. К первой группе относятся интервалы, на которых отражена работа голосовых связок. Эти участки будем называть тональными участками речевого сигнала. К ним относятся участки гласных и звонких согласных звуков. Вторая группа - это участки речевого сигнала, на которых амплитуда сигнала не равна нулю, но голосовые связки не работают. Условно их можно назвать нетональными участками речевого сигнала. К ним относятся, например, шипящие и взрывные звуки. Третья группа - это участки звуковых пауз. При кажущейся, на первый взгляд, неинформативности звуковых пауз они, тем не менее, в совокупности с тональными и нетональными участками речевого сигнала, составляющими в целом речевой сигнал определенной фразы, также отражают индивидуальные особенности речи[14].

Такая классификация участков речевого сигнала не является общепринятой, однако она оправдана для криминалистических целей. Из всех акустических параметров наибольший интерес для криминалистики представляют следующие параметры:

- наиболее отражающие индивидуальные особенности речи;

- надежно выделяемые из речевого сигнала;

- наименее искажаемые аппаратурой звукопередачи и записи;

- поддающиеся измерению в шумах с высокой степенью точности.

Среди этих параметров можно выделить: периодичность работы голосовых связок, периодичность следования тональных участков речевого сигнала, длительность периодов смычных и смычно-проходных звуков и т.п. Одной из информативных совокупностей таких признаков являются параметры узкополосных спектров тональных участков, отражающих периодичность работы голосовых связок. Высокая информативность этой совокупности обусловлена проявлением в ней индивидуальных особенностей одновременно двух систем - анатомического строения[15] и нейрофизиологического регулирования голосообразования[16].

Звуковые паузы и нетональные участки речевых сигналов менее информативны для решения криминалистических задач. Обычно на практике используются следующие основные параметры этих участков: их длительность и, если проявляются, формантные особенности шипящих звуков в области частот ниже 4-6 кГц. Остальные параметры, например форма и спектр импульса взрывного звука, обычно не используются из-за сильного искажения и принципиальной невозможности допустимо точного оценивания в шумах (в силу их одиночности в окрестности квазипостоянства характеристик искажающих факторов).

Следует отметить, что, имея приемлемую технологию выделения тональных и нетональных участков речевого сигнала, уже можно исследовать индивидуальные особенности их чередования. Однако эти особенности тесно связаны с семантической стороной речевого сигнала и в настоящей работе не рассматриваются. Основное внимание будет уделено исследованию фониатрических особенностей голоса в речи.

В природе речеобразования выделяются три основных фактора, определяющих конкретный вид тональных участков:

- форма импульса голосового возбуждения речевого тракта;

- периодичность следования голосовых импульсов;

- форма речевого тракта.

Подчеркнем, что индивидуальность речевого сигнала в значительной мере проявляется не в статике, а в динамике этих факторов. Указанные факторы являются базисными, определяющими все остальные воспринимаемые слухом человека и аппаратурно измеряемые признаки тональных участков. Например, такой признак, как чистота звучания голоса, обусловливается одновременно стабильностью формы голосовых импульсов и стабильностью периода их следования друг за другом. Тембр голоса определяется формой голосового импульса и формой речевого тракта.

Для криминалистических целей необязательно знание именно базисных признаков, например, формы голосового импульса или стереометрического описания динамики формы речевого тракта. Главное - знать, в каких группах измеряемых акустических параметров базисные группы признаков находят свое отражение, чтобы криминалистическое исследование голоса в речи было предельно полным. При этом следует различать, какие признаки отражают артикуляционные, а какие - голосовые. Поэтому, опираясь на базисные факторы, определяющие конкретные измеримые характеристики тональных участков, и учитывая то, что в них отражаются те или иные индивидуальные особенности говорящего, можно попытаться разбить акустические признаки тональных участков на три класса, по типу упомянутых выше факторов.

Получающиеся классы признаков не будут непересекающимися. Например, такой признак, как смещение измеряемых обертонов от соответствующих гармоник основного тона, зависит одновременно и от формы импульса голосового возбуждения, и от формы речевого тракта, и от частоты основного тона голоса, и, более того, от способа измерения частоты обертонов. Поэтому некоторые измеримые акустические признаки тональных участков могут быть отнесены не только к одному из вышеуказанных классов.

Как уже отмечалось, измерение и исследование группы признаков, связанных в большей мере с анализом широкополосных спектров тональных участков, развиты достаточно хорошо.

Из группы акустических параметров тональных участков, отражающих периодичность и постоянство формы голосовых импульсов, в настоящее время исследованы некоторые статистические признаки периодичности следования голосовых импульсов. Результаты исследования частотной модуляции голоса, чистоты звучания голоса, статистических параметров производной контура частоты основного тона и некоторые другие только обозначены в научной литературе. Проведение этих и многих других исследований, изучающих особенности периодичности работы голосовых связок, сильно ограничены возможностями точного измерения соответствующих параметров, в особенности частоты основного тона.

Касаясь вопроса автоматизации решения криминалистических задач опознавания личности по речи, отметим следующее. Предусмотреть в алгоритмической схеме исследования все нюансы, начиная от чисто технических особенностей качества фонограммы речи и кончая умышленным искажением голоса говорящим, в настоящее время практически невозможно. Поэтому на данном этапе развития системы криминалистической идентификации личности по речи основное внимание уделяется измерению и наглядному отражению всех возможных акустических параметров речевых сигналов, которые могут понадобиться в ходе криминалистического исследования. Причем измерения, статистическая обработка и отображение результатов производятся с высокой степенью точности, надежности и автоматизации.


[1] Цитируется по электронному справочнику «Википедия»: http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D0%B4%D0%B8%D0%BE

[2] Цитируется по электронному справочнику «Википедия»: http://ru.wikipedia.org/wiki/%D0%AD%D0%BC%D0%B8%D0%BB%D1%8C_%D0%91%D0%B5%D1%80%D0%BB%D0%B8%D0%BD%D0%B5%D1%80.

[3] Цитируется по сайту газеты “The New York Times”:

http://www.nytimes.com/2008/03/27/arts/27soun.html?pagewanted=1&_r=3&adxnnlx=1206627201-CSndVe9JSmeQNMgVco5GgA.

[4] Цитируется по электронному справочнику «Википедия»: http://ru.wikipedia.org/wiki/%D0%9C%D0%B0%D0%B3%D0%BD%D0%B8%D1%82%D0%BE%D1%84%D0%BE%D0%BD.

[5] Potter R.K. Visible Patterns of Sound // Science. № 2654. November 9. 1945.

[6] The Sound Spectrograph // The Journal of the Acoustical Society of America. 1946. Vol. 18.

[7] Рамишвили Г.С. Автоматическое опознавание говорящего по голосу. - М.: Радио и связь, 1981.

[8] Computer-aided voice identification comes of age // Law and order. 1983. Vol. 31. № 7.

[9] Hollien H., McGlone R. An evaluation of the "voiceprint" technique of speaker identification // Proc. 1976 Carnachan conference on crime countermeasures. - Lexington: University of Kentucky, 1976.
Hollien H. Status report of "voiceprint" identification in the United States // Proc. 1977 International conference on crime countermeasures - Science & Engeneering. - Lexington: University of Kentucky, 1977.

[10] Koenig B.E. Spectrographic voice identification: A forensic survey // The Journal of the Acoustical Society of America. 1986. Vol. 79. № 6.

[11] Shipp Th., Doherty E.Th., Hollien H. Some Fundamental Considerations Regarding Voice Identification // The Journal of the Acoustical Society of America. 1987. Vol. 82. № 2.

[12] Koenig B.E., Ritenour D.V., Kohus B.A., Kelly A.S. Reply to "Some Fundamental Considerations Regarding Voice Identification" // The Journal of the Acoustical Society of America. 1987. Vol. 82. № 2.

[13] Фант Г. Акустическая теория речеобразования: Пер. с англ. Л.А.Варшавского, В.И.Медведева / Под ред. В.С.Григорьева.- М.: Наука, 1964.

[14] Разработка экспертной методики идентификации личности по маг-нитным фонограммам устной речи, основанной на лингвистическом анализе и обработке речевых сигналов на ЭВМ. Отчет по теме НИР-85. УДК 343.997.33. Инв. № О-827. - М.: ВНИИ МВД СССР, 1985.

[15] Фант Г. Акустическая теория речеобразования: Пер. с англ. Л.А.Варшавского, В.И.Медведева / Под ред. В.С.Григорьева.- М.: Наука, 1964.
Разработка экспертной методики идентификации личности по маг-нитным фонограммам устной речи, основанной на лингвистическом анализе и обработке речевых сигналов на ЭВМ. Отчет по теме НИР-85. УДК 343.997.33. Инв. № О-827. - М.: ВНИИ МВД СССР, 1985.

[16] Юссон Р. Певческий голос. Исследование основных физиологических и акустических явлений певческого голоса. - М.: Музыка, 1974.





Hosted by uCoz