Машины, которые говорят и слушают
Рефераты >> Кибернетика >> Машины, которые говорят и слушают

При создании модульной системы предусматривалось:

а) получить такую полную модель в алгоритмической форме, что­бы процесс был представлен с исчерпывающей полнотой;

б) обеспечить работу системы для моделей переменной слож­ности, например, чтобы система работала с фиксированным словарем иди без учета просодических параметров;

в) обеспечить развитие и достаточную гибкость системы,что­бы изменения, которые должны быть внесены в один структурный Уровень, не требовали изменения других уровней;

г) реализовать эффективную работу отдельных частей алгоритма» ориентируясь на специфику применения систем речевого ' ответа;

^и этом доляно учитываться использование специального обору­дования, обеспечивающего минимальные габариты системы,время фор­мирования фразы, мощность и стоимость системы. 67

Модульное матобеспечение, реализующее эти требования, произ-водит анализ текста и синтез речи. На стадии анализа создается некая абстрактная лингвистическая структура, общая как для вход-ного текста, так и для речевого вывода. Основными программными модулями при создании такой структуры являются:

1. Модуль "Формат", обеспечивающий предварительную обработ­ку входного текста в форм;', удобную для морфологического ана­лиза и порождения соответствующей фонемной цепочки.

2. Модуль "Декомпозиция1', осуществляющий морфологический ана-диз и находящий каждое слово в лексиконе морфем, представляет последовательность морфем, составляющих входной текст, кодами, учитывающими их особенности произнесения (в сочетании с дру­гими морфемами) и грамматические функции.

3. Модуль "Парсер" (грамматический разбор) работает с цепоч­кой морфем и определяет, к какой части речи принадлежит каждое слово; этот модуль строит грамматические сети и формирует фразы, объединяя слова в словосочетания, на которые далее будет нак­ладываться соответствующий интонационный контур; основная роль этого модуля - разрешать фонемные неопределенности (что-то убрать, что-то добавить) и производить лингвистические описания, необ­ходимые для временных процедур, и процедуры наложения контура основного тона.

4. Модуль "Звук-1", в котором морфофонетические правила (множественного числа, прошедшего времени, палаталлэации) приме­няются к словам, анализировавшимся модулем "Декомпозиция"; эти правила очищают фонетическую цепочку и позволяют объединять два иди более смежных корня в составное слово , а также построить для слова соответствующий контур ударения.

5. Модуль "Звук-2" использует правила перевода букв (графем) в звуки для порождения фонетической последовательности, если модуль "Декомпозиция" не смог полностью превратить слова в пос­ледовательность лексических морфем. После превращения последова­тельности букв в последовательность фонетических символов этот модуль использует полный набор правил лексического ударения, опре­деляющих контур ударности для этого слова (эти правила, нап­ример, определяют Правильность произношения аффикса ate в словах eyatematio и eyetemeUze).

При синтезе речи используется набор модулей, обеспечивающих порождение входной речевой водны:

- модуль "Просодика"» определяющий для каждой фонемы форми­руемого предложения частоту основного тона, длительность и интен­сивность (ударность);

68

- модуль "Синтез", используя фонетические метки и проводи-ивокую ш«формацию, каждые б мо порождает параметры, достаточные •ля управления цифровой модель» речевого тракта, формирующей от-очеты речевой волны. Модуль "Синтез" - ато большая программа, мализуккцая алгоритм фонетического синтеза речи по правилам с дополнительным наложением просодического контура;

- модуль "Речь" превращает полученную последовательность десантных отсчетов в речевую волну, используя цифроаналоговый Преобразователь.

В [133] рассмотрена интерактивная система исследования ре­чи tiK; , чозвояяищая в диалоговом режиме изучать и модернн-ащювать правила преобразования "текст - фонема", что дает воз­можность получать более качественную синтетическую речь. Система spy использует три вида правил преобразования (рис.1.4):

1) правила модификации текста, модифицирующие начальную тек-стоьуь строку и связанные с ней признаки;

2) правила конверсии, формирующие цепочку фонем и связанную в ней матрицу признаков на основе информации, имеющейся в мо­дифицированной текстовой строке;

3) правила модификации признаков, которые изменяют матрицу признаков, формируемую правилами конверсии.

Рассмотрим алгоритм преобразования "текст-фонема",реализован­ный в [I33J , на примере преобразования слова.

На вход программы преобразования поступает слово, каждой бук­ве которого соответствует присоединенный признак, определяющий глаонке или согласные звуки, соответствующие етим буквам:

с буква

согл

(символы)

(присое­диненные)

признаки

a r L п д

буква буква букяа буква буква

глад. оогл. глао. согл. глас.

На аерьом уровне текстовая цепочка и связанная о ней матрица Признаков модифицируются множеством правил модификации текста. б»н аравиле могут устранять, добамнгь и заменять символы,а так-*• делать соответствуххцие ыодифхнации матрицы признаков. Правила ч^дифинации •мжста, например, вводят символ е*' после гласного, »» которым следует один или два согласных, и перед суффиксами <t/ и Ing .

69

Текст и признаки

Правила модификации текста (ТМ-правила)

Модифицированный текст и признаки

Правила конверсии (С-правила)

Фонемы и признаки

( W-правила)

Правила модификации признаков Модифицированные признаки

Рис. 1.4. Три уровня правил преобразования "текст-фонема1' сис­темы SRS

sharing

+s/?are+. ing+

Ce] [C]

Правила модификации текста I. 0---e+/l/c[?,2L{ed|^}

Пракиха конверсии

И. а—р/_с[* соп}е^

Правила модификации признаков

3. [\tfns\ [-tens'] /_ [+ ret]

Применение ТМ-оравмя к сяоэу carlna дает:

< с а г е + i n (f буква буква букм буква буква буква буква соги. глас. согя. гяас. пас. согя. согд.

Таким обозом, эти аравияа вводят новую букву е , а также опредедяшт границу модемы "+" и суффикса " •". (Введенные си»»-воям служ*»т важной частью иравия контекста, которые исоояьауются С- и / М-правияами.)


Страница: