Речеэлементные методы

Речеэлементные методы можно разделить на две группы: фонемные и все остальные (слоговые, диадные, триадные, словесные, командные). Из всех ранее рассмотренных методов компрессии речевого сигнала речеэлементные методы представляют наибольшее приближение к наибольшей компрессии речи. Можно объяснить это на простом примере фонемного метода.

В русской речи содержится 41 фонема, поэтому достаточно иметь шестизначный код, чтобы передавать не только фонемы, но и ряд других сигналов, отражающих некоторые данные о голосе и эмоциях говорящего (далее диктора). При средней скорости произнесения 10 фонем в секунду требуемая пропускная способность составит 60 бит/с, а с учетом передачи нескольких интонаций около 200 бит/с. Следовательно, коэффициент компрессии фонемного вокодера может достигать 1000. Такую передачу называют говорящим телеграфом (рисунок 2.3.1) Кроме звучащего телеграфа существуют фонемные вокодеры с передачей ряда индивидуальных особенностей речи и голоса, но дают меньшие величины компрессии речи.

Наметилось два направления разработки речеэлементных вокодеров. Сущность методов первого сводится к распознаванию элементов речи в передающем устройстве, кодированию их для передачи по каналу связи и восстановлению в приемном устройстве по образцам, находящимся в его памяти.

По методам, относящимся ко второму направлению, в передающем устройстве, кроме распознавания элементов речи, происходит определение основного тона, уровня интенсивности, длительности звучания каждого элемента, тембра голоса и др. Все эти данные кодируются и передаются по каналу связи. Приемное устройство синтезирует речь, используя аналог речевого тракта, управляемого пришедшими из передающего устройства кодовыми сигналами. Каждый из последних предварительно попадает в процессор, который определяет такие параметры речевого тракта, как частоты и полосы формант, выходное нагрузочное сопротивление, а по ним величины элементов электрического аналога тракта: индуктивностей, емкостей, сопротивлений и проводимостей звеньев тракта. Последний выполняется в виде системы с распределенными параметрами.

Речеэлементные методы обладают еще одной особенностью. Все предыдущие методы преобразования в основном предназначаются для компрессии речевого сигнала на передаче с целью уменьшения требуемой пропускной способности канала связи. На приемном конце сигнал снова расширяется, как правило, до исходного объема, т.е. в той или иной степени происходит восстановление первоначального сигнала. Речеэлементные методы преобразования речи имеют целью, как компандирование речевого сигнала, так и использование речевого сигнала для управления процессами и механизмами, а также для превращения кодовых сигналов в речевой.

Таким образом, речеэлементные методы анализа и синтеза речи могут быть как связаны между собой общей задачей, так и самостоятельными. В первом случае надо иметь в виду, что в конце концов сигнал воспринимается слуховым аппаратом человека, по этому следует сохранить (или восстановить) все свойства речевого сигнала, необходимые для его восприятия. Во втором случае сигналы от распознанных элементов речи управляют машинами и процессами, по этому нет необходимости в сохранении специфических для восприятия параметров. Иными словами, не обязательно копировать человеческий слуховой анализатор речи.

Процесс восприятия звуков речи слуховым анализатором человека может быть разделен на 3 этапа [14]: акустический, фонетический, лингвистический. На первом этапе сигнал анализируется как физическая величина. В результате анализа определяется комплекс параметров, пока еще не отождествленных с какими-либо параметрами, находящимися в памяти. На втором этапе происходит их сравнение с параметрами, находящимися в памяти, и первичное распознавание звука речи. Третий этап заключается в уточнении звука речи по различным связям между звуками речи, в частности по смыслу. При артикуляционных испытаниях ограничиваются преимущественно первыми двумя этапами, но при фонемном кодировании непрерывной речи следует учитывать все три этапа восприятия звуков речи.

Методы фонемного анализа можно разделить на две группы. К первой группе относятся все методы, основанные на анализе акустических параметров звуков речи, таких как, например спектральные, временные и спектрально-временные характеристики, а также формантные переходы, изменение временных интервалов между переходами речевого сигнала через ноль и др. К акустическим методам относятся также метод определения взаимозависимости между различными параметрами (например, между формантными частотами) и корреляционные методы. Вторую группу составляют методы, основанные на фонетических признаках звуков речи, таких как звонкость - глухость, диффузность - компактность, шумность, длительность, интенсивность и т.п. Конечно, эти дифференциальные признаки в той или иной степени связаны с акустическими параметрами и поэтому являются инвариантными признаками звуков речи.

Перейти на страницу: 1 2

Другое по теме:

Техническое обслуживание и ремонт кабельных линий
Как известно основа надёжного электроснабжения потребителей электрической энергией - безаварийная работа кабельных линий. Бесперебойное электроснабжение потребителей городских сетей и промышленных предприятий зависит от принят ...

Исследование систем управления манипулятором MR-999Е
Зрительные возможности робота, как и людей, обеспечиваются сложным чувствительным механизмом, который позволяет гибко реагировать на изменения внешней среды. Использование технического зрения и других методов очувствления дик ...

©  www.techvarious.ru - 2019