Машины, которые говорят и слушаютРефераты >> Кибернетика >> Машины, которые говорят и слушают
При объединении фраз, име'"'аих нарастающую каденцию, частота 7» яосле возрастания на конце первой фразы начинает оинусоидадь-"0 уменьшаться на границах между фразами. Сяад частоты начина-
1)Ййу«Моп80 мс ifiP начала второй фразы и имеет общую длительность, «-""ую 190 мс. Далее f продолжает уменьшаться ооТторосгыо пол-
'°на в I с. ^
В конечных фразах синтезируемого высказывания, где существует каденция типа FC, в начале фраз fg соответствует частоте основного тона, которая определяется предшествующей • нарастающей каденцией. Однако за 80 мс до начала гласного ^.определяющего главное ритмическое ударение, /д начинает синусоидально уменьшаться в течение 190 мс до величины, равной двум полутонам по отношению к основному тону в начале предложения. Далее f продолжает уменьшаться со скоростью полтона в I с, пока не закончится предложение.
Изменение основного тона на ударных слогах зависит от того, какой гласный содержит ударный слог: короткий или длинный. В обоих случаях 5-тип основного тона состоит из нарастающего и падающего участков. Это нарастание начинается за 80 мс до начала гласного и продолжается для коротких слогов 160 мс,для длинных - 240 мс. Такое же время продолжается и синусоидальный спад для слогов первого и второго типа. В зависимости от силы ударения подъем частоты основного тона лежит в пределах от двух до пяти полутонов, а спад - от полутона до двух полутонов.
Исследования по управлению просодическими параметрами описаны в [122] . В [2, 103, 104, 163] приводятся исследования различных синтаксических структур и их влияние на микро- и макровариации частоты основного тона в английской речи.Результатом исследований был алгоритм, определяющий динамику основного тона синтезированной английской речи. Алгоритм рассматривается как последовательность двух уровней единой системы, формирующей контур основного тона. На первом (высшем) уровне учитывается влияние синтаксической и семантической информации, на втором (низшем) -информации о фонемной цепочке и лексическом ударении (рис.1.3).
оинтаксическая |
Система верхнего уровня |
Просодические |
Система нижнего уровня |
УР в- | ||
информация Семантическая | ||||||
индикаторы | ||||||
информация |
Фонетическая |
J • | • \ Конт осно ного | |||
информация Информация |
Рис. 1.3. Структура алгоритма, определяющего динамику основного тона синтезированной речи
62
рассмотрим далее алгоритм, реализующий формирование контура основного тона для высказывания, в общем случав содержащего несколько предложений, каждое из которых разбивается на фразы, состоящие из нескольких слов. Для формирования контура основного тона на вход системы высшего уровня поступает информация о типе высказывания, границах и типах предложений, границах и типах фраз, а также о том, какой частью речи является каждое сдово. Слова упорядочены по степени важности, причем к словам, не входящим в список важных, относятся артикли, союзы, относительные местоимения, предлоги, вспомогательные глаголы и личные 1|еетоимения. Для каждого высказывания формализована его синтаксическая структура, т.е. для ввода производится идентификация синтаксических единиц: выделяются независимые или зависимые пред-яожения, внутри которых локализуются и маркируются фразы существительного, фразы глагола, предложные фразы, фразы, связанные с прияагательным или употребляющиеся в качестве прилагательных, фразы, соответствующие наречиям. В системы вводится также информация о специальных фразах и пунктуации, определяющая тип мамровариаций основного тона:
а) обычные вопросительные и звательные фразы, характеризующиеся повышением частоты основного тона;
б) знаки цитирования и восклицания, усиливающие изменения частоты основного тона внутри своих областей;
в) "ответвления" фраз (куски высказываний со скобками или тире), уменьшающие динамику основного тона;
г) знак вопроса в конце предложения, дающий тон типа В для каждого независимого предложения, не содержащего вопросительного слова; остальные предложения, дающие тон типа А.
Влияние семантики на контур основного тона учитывается ак-центацией слов, их ранжированием по степени важности, а также временной близостью одинаковых слов. Каждое существительное, глагол или прилагательное высказывания запоминаются в буферной магазинной памяти, способной хранить до 50 слов. Новые слова сравниваются с содержимым буфера. Для каждого сравнения характер изменения /д коррелируется с тем, на каком месте буфера находится слово, с который сравнивается вновь поступившее. Чем ближе находится слово, аналогичное входному, тем более высокая степень редукции /д .
Типы тона А и В характеризуются следующим: тон типа А вызывает снижение /д на всем предложении, а также резкое падение его на последнем важном (значащем) слове и после этого.
63
Тип В означает относитеяьно пологую /д с резким подъемом в конце предложения. Эти типы тонов характеризуют глобальный уровень иерархии в рассматриваемой системе.
Предложения, не являющиеся конечными (т.е. уже не связанные с типом тона), характеризуются подъемом fy на первом значащем слове и его падением на последнем значащем слове (падении меньшем, чем при тоне типа А), после чего начинается новый последовательный подъем. Размах "понижение - нарастание" частоты основного тона fy зависит от идентичности предыдущему следующего предложения: если за предвдущим следует независимое предложение, то изменение основного тона на стыке больше, чем в случае, когда второе предложение является зависимым. Более того, если в высказывании остается единственное зависимое предложение, то подъем основного тона после завершения независимого пред. ложения пропадает вообще. Весь участок "падение - подъем" основного тона может не выявиться, если границы независимого предложения включают начало ограниченного вводного предложения (в зависимости от числа слов, предшествующих границе: чем меньше слов, тем меньше Провал "падение - подъем fg ").
Внутри каждого предяожения в дополнение к изменению на границах предложений происходят изменения /д и на границах фраз в зависимости от числа "важных" слов в каждом предложении. Каждая фраэа с двумя и болев такими словами выделяется таким образом, что ее начало совпадает с нарастанием частоты основного тона, а завершение - со снижением и последующим подъемом. Изменение частоты основного тона на границах фраз зависят от числа "важных" слов фразы, т.е. фразам с большим числом таких слов соответствует больший "провал" частоты основного тона; увеличивают этот провал также границы, помеченные знаками пунктуации. Внутри фраз начальный подъем fy продолжается на первом важном слове, а падение заканчивается на последнем важном слове этой фразы с неким подъемом к концу фразы. Все остальные важные слова "получают" подъем и снижение /д примерно одинаковой величины.