Вокодерные системы передачи речевой информации

Речь является важнейшим средством коммуникации между людьми. По своим характеристикам и свойствам она достаточно специфична и уникальна. Соответственно речь, как основа человеческого общения и взаимодействия, является предметом пристального внимания множества научных исследований и технических разработок в сфере управления и телекоммуникаций. Целью такого внимания является создание качественно новых систем передачи речевой информации. Результатами развития в этом направлении становятся высокоэффективные и надежные средства связи, системы автоматического голосового управления с возможностью верификации, справочные системы с речевым ответом, новые возможности в сферах медицинского обслуживания, обучения или развлекательного характера и т.д.

Одной из важнейших задач, о чем можно судить по уделяемому ей вниманию, являются исследования речевого сигнала в области низкоскоростной передачи. В этом направлении, несмотря на многолетнюю работу, имеется еще много нерешенных задач. Создание систем низкоскоростной передачи с высоким качеством восприятия сигнала, способных функционировать и взаимодействовать с человеком в реальных условиях, систем распознавания слитной речи на фоне мешающих факторов при объективной методике оценки качества восприятия речи позволит эти проблемы решить.

Главной задачей на сегодня является уже не только достижение минимальной избыточности, но и качество звучания речевых сигналов, восстановленных в низкоскоростных системах передачи, т.е. восприимчивость и разборчивость для человеческого слуха, без значительного снижения эффективности обработки и передачи при наличии шумов. В частности вокодерные системы хотя и обеспечивают приемлемую разборчивость, но не могут обеспечить хорошее качество получаемого сигнала. Также при обработке полностью теряются индивидуальные особенности голоса; речь звучит механически, случаются посторонние звуки. При этом следует найти оптимальный баланс между качеством и скоростью передачи. Особенно важен этот вопрос для беспроводных систем связи, по причине ограниченности радиочастотного ресурса и необходимостью обработки огромного массива данных, для каналов управления и линий командной связи, а также различных устройств с голосовым управлением. Также этот вопрос значителен еще и потому, что в современных цифровых системах производятся большое количество математических операций для обработки сигнала, так как они требуют больших вычислительных затрат и, соответственно, снижают быстродействие и дают общую задержку.

Одним из решений может служить фонемный вокодер с варьируемым набором передаваемых параметров, т.е. адаптацией соотношения скорость/качество под конкретную задачу. Использование такого типа вокодеров позволит максимально снизить естественную избыточность речевых сигналов. Его применение позволит обеспечить пользователя качественной голосовой связью при высоком уровне конфиденциальности в реальном масштабе времени.

Использование низкоскоростного вокодера позволит за счет уменьшения объема передаваемых данных позволит понизить стоимость передаваемой информации, освободить часть ресурсов систем передачи для других пользователей, что выгодно как пользователям, так и представителям услуг связи.

Одними из первых потребителей вокодерных систем в нашей стране были военные и правительственные ведомства, и для них не являлось первостепенным качество речи, т.е. натуральность ее звучания и распознаваемость говорящего.

В настоящее время в связи с появлением цифровых сетей и соответствующего абонентского оборудования, компьютерной телефонии, спутниковой и сотовой систем связи требования изменились. Использование цифровых методов представления, обработки и передачи приводит к многократному увеличению занимаемой полосы частот и, как следствие этого, к многократному увеличению скорости передачи информационных сообщений. При этом для потребителя не мало важным является качество предоставляемых услуг, в данном случае восприимчивость речи на слух после передачи. Кроме того, информация в большинстве случаев носит частный, конфиденциальный характер.

Применение фонемных вокодеров дает самую низкую информационную скорость среди существующих кодеров (от 1500 до 100бит/с), что позволяет передавать сигнал по более узкому каналу и при этом получить менее зашумленный и более разборчивый речевой сигнал. Это объясняется обратной зависимостью между скоростью передачи и отношением сигнал/шум: чем выше скорость передачи, тем ниже отношение сигнал/шум [14]. Помимо этого при худшем качестве канала связи требуется большая мощность передатчика, чтобы протолкнуть информацию по такому каналу причем зависимость квадратичная). Также низкая скорость позволит применить более сложные алгоритмы кодирования, а передача дополнительных речевых характеристик, таких как интонации, стилистические особенности речи и применение более сложного алгоритма распознавания позволит повысить качество речи.

В итоге применение фонемных вокодеров дает:

использование малогабаритных передатчиков с низким энергопотреблением (следствие низких требований к мощности);

возможность использования узкополосных каналов (экономия дефицитного РЧР и повышение качества передаваемой информации);

максимальная степень конфиденциальности;

высокая информационная емкость при удовлетворительном качестве на уровне 3-4 балла (рисунок 1.1).

Все это при минимальной стоимости программного продукта и высокой надежности аппаратуры делает данный вокодер конкурентоспособным, а так как имеется большой спрос в различных отраслях, то успешная реализация обеспечена.

В таблице 1.1 показаны некоторые стандарты сжатия речи, используемые в кодеках низкоскоростных систем передачи [18]. Более подробно алгоритмы кодирования рассмотрены в разделе 3.

рисунок 1.1

Таблица 1.1

Стандарт

Организация

Тип кодирования

Скорость Kбит/с

1

FS1015

Secure Voice Communication USA

LSF

2.4

2

JDC-HR

Japanese Cecular

PSI-CELP

3.67

3

FS1016

Secure Voice Communication USA

CELP

4.8

4

GSM-HR

Eropean Cecular

RPE-LTP

7.8

5

ITU

ITU-T

VCELP

8

6

GSM

Eropean Cecular

RPE-LTP

13

7

G.728

ITU-T

LD-CELP

16

8

G.726

ITU-T

ADCPM

32

9

G.711 m, A закон

ITU-T

PCM

64

    Другое по теме:

    Расчет волноводной фазированной антенной решетки с вращающейся поляризацией
    Одной из наиболее быстро развивающихся областей радиоэлектроники является техника антенн и устройств СВЧ. Уровень ее развития во многом определяет состояние телекоммуникационных систем, радиолокации, навигации, ...

    Разработка функциональных узлов цифровой системы передачи
    Постоянно растущие объёмы передаваемой информации, расширение номенклатуры услуг и ряд других факторов ставят задачи непрерывного увеличения пропускной способности и скорости передачи данных в цифровых системах передачи. Одна ...

    ©  www.techvarious.ru - 2018