Машины, которые говорят и слушаютРефераты >> Кибернетика >> Машины, которые говорят и слушают
При создании модульной системы предусматривалось:
а) получить такую полную модель в алгоритмической форме, чтобы процесс был представлен с исчерпывающей полнотой;
б) обеспечить работу системы для моделей переменной сложности, например, чтобы система работала с фиксированным словарем иди без учета просодических параметров;
в) обеспечить развитие и достаточную гибкость системы,чтобы изменения, которые должны быть внесены в один структурный Уровень, не требовали изменения других уровней;
г) реализовать эффективную работу отдельных частей алгоритма» ориентируясь на специфику применения систем речевого ' ответа;
^и этом доляно учитываться использование специального оборудования, обеспечивающего минимальные габариты системы,время формирования фразы, мощность и стоимость системы. 67
Модульное матобеспечение, реализующее эти требования, произ-водит анализ текста и синтез речи. На стадии анализа создается некая абстрактная лингвистическая структура, общая как для вход-ного текста, так и для речевого вывода. Основными программными модулями при создании такой структуры являются:
1. Модуль "Формат", обеспечивающий предварительную обработку входного текста в форм;', удобную для морфологического анализа и порождения соответствующей фонемной цепочки.
2. Модуль "Декомпозиция1', осуществляющий морфологический ана-диз и находящий каждое слово в лексиконе морфем, представляет последовательность морфем, составляющих входной текст, кодами, учитывающими их особенности произнесения (в сочетании с другими морфемами) и грамматические функции.
3. Модуль "Парсер" (грамматический разбор) работает с цепочкой морфем и определяет, к какой части речи принадлежит каждое слово; этот модуль строит грамматические сети и формирует фразы, объединяя слова в словосочетания, на которые далее будет накладываться соответствующий интонационный контур; основная роль этого модуля - разрешать фонемные неопределенности (что-то убрать, что-то добавить) и производить лингвистические описания, необходимые для временных процедур, и процедуры наложения контура основного тона.
4. Модуль "Звук-1", в котором морфофонетические правила (множественного числа, прошедшего времени, палаталлэации) применяются к словам, анализировавшимся модулем "Декомпозиция"; эти правила очищают фонетическую цепочку и позволяют объединять два иди более смежных корня в составное слово , а также построить для слова соответствующий контур ударения.
5. Модуль "Звук-2" использует правила перевода букв (графем) в звуки для порождения фонетической последовательности, если модуль "Декомпозиция" не смог полностью превратить слова в последовательность лексических морфем. После превращения последовательности букв в последовательность фонетических символов этот модуль использует полный набор правил лексического ударения, определяющих контур ударности для этого слова (эти правила, например, определяют Правильность произношения аффикса ate в словах eyatematio и eyetemeUze).
При синтезе речи используется набор модулей, обеспечивающих порождение входной речевой водны:
- модуль "Просодика"» определяющий для каждой фонемы формируемого предложения частоту основного тона, длительность и интенсивность (ударность);
68
- модуль "Синтез", используя фонетические метки и проводи-ивокую ш«формацию, каждые б мо порождает параметры, достаточные •ля управления цифровой модель» речевого тракта, формирующей от-очеты речевой волны. Модуль "Синтез" - ато большая программа, мализуккцая алгоритм фонетического синтеза речи по правилам с дополнительным наложением просодического контура;
- модуль "Речь" превращает полученную последовательность десантных отсчетов в речевую волну, используя цифроаналоговый Преобразователь.
В [133] рассмотрена интерактивная система исследования речи tiK; , чозвояяищая в диалоговом режиме изучать и модернн-ащювать правила преобразования "текст - фонема", что дает возможность получать более качественную синтетическую речь. Система spy использует три вида правил преобразования (рис.1.4):
1) правила модификации текста, модифицирующие начальную тек-стоьуь строку и связанные с ней признаки;
2) правила конверсии, формирующие цепочку фонем и связанную в ней матрицу признаков на основе информации, имеющейся в модифицированной текстовой строке;
3) правила модификации признаков, которые изменяют матрицу признаков, формируемую правилами конверсии.
Рассмотрим алгоритм преобразования "текст-фонема",реализованный в [I33J , на примере преобразования слова.
На вход программы преобразования поступает слово, каждой букве которого соответствует присоединенный признак, определяющий глаонке или согласные звуки, соответствующие етим буквам:
с буква согл |
(символы) (присоединенные) признаки |
a r L п д
буква буква букяа буква буква
глад. оогл. глао. согл. глас.
На аерьом уровне текстовая цепочка и связанная о ней матрица Признаков модифицируются множеством правил модификации текста. б»н аравиле могут устранять, добамнгь и заменять символы,а так-*• делать соответствуххцие ыодифхнации матрицы признаков. Правила ч^дифинации •мжста, например, вводят символ е*' после гласного, »» которым следует один или два согласных, и перед суффиксами <t/ и Ing .
69
Текст и признаки
Правила модификации текста (ТМ-правила)
Модифицированный текст и признаки
Правила конверсии (С-правила)
Фонемы и признаки
( W-правила) |
Правила модификации признаков Модифицированные признаки
Рис. 1.4. Три уровня правил преобразования "текст-фонема1' системы SRS
sharing +s/?are+. ing+ Ce] [C] |
Правила модификации текста I. 0---e+/l/c[?,2L{ed|^}
Пракиха конверсии
И. а—р/_с[* соп}е^
Правила модификации признаков
3. [\tfns\ [-tens'] /_ [+ ret]
Применение ТМ-оравмя к сяоэу carlna дает:
< с а г е + i n (f буква буква букм буква буква буква буква соги. глас. согя. гяас. пас. согя. согд.
Таким обозом, эти аравияа вводят новую букву е , а также опредедяшт границу модемы "+" и суффикса " •". (Введенные си»»-воям служ*»т важной частью иравия контекста, которые исоояьауются С- и / М-правияами.)