Министерство образования и науки Российской Федерации
УНИВЕРСИТЕТ ИТМО
Ю. Н. Матвеев, С. В. Рыбин
Методические указания по выполнению
лабораторных работ по курсу «Синтез речи»
РЕКОМЕДОВАНО К ИСПОЛЬЗОВАНИЮ В УНИВЕРСИТЕТЕ ИТМО
по направлению подготовки «информационные системы и
технологии»
в качестве учебно-методического пособия для реализации
основных образовательных программ высшего образования
магистратуры
Санкт-Петербург
2017
2
Матвеев Ю. Н. , Рыбин С. В. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО
ВЫПОЛНЕНИЮ ЛАБОРАТОРНЫХ РАБОТ ПО КУРСУ «СИНТЕЗ РЕЧИ». Учебно-методическое пособие. СПб: Университет ИТМО, 2017. – 45с. Методические указания предназначаются для магистрантов направления
09. 04. 02, изучающих дисциплину «Синтез речи». Лабораторные работы,
представленные в методических указаниях, составляют практикум по курсу
"Синтез речи" и помогут студентам подробно ознакомиться с технологией
синтеза интонационной речи. В лабораторных работах используется программный комплекс Vital Voice Tools,
разработанный на базовом предприятии кафедры «Центр речевых технологий». В первом разделе пособия дано краткое описание функциональных возможностей
данного комплекса. Каждая лабораторная работа начинается с теоретического
введения, которое содержит основные сведения, необходимые для выполнения
лабораторных работ, и составление отчетов по ним. Рецензент: д. ф. -м. н.
Коточигов А. М. Рекомендовано к печати Ученым советом факультета Информационных
технологий и программирования 21. 10. 2017 г. , протокол № 10
Университет ИТМО – ведущий вуз России в области информационных и
фотонных технологий, один из немногих российских вузов, получивших в 2009
году статус национального исследовательского университета. С 2013 года
Университет ИТМО – участник программы повышения конкурентоспособности
российских университетов среди ведущих мировых научно-образовательных
центров, известной как проект «5 в 100». Цель Университета ИТМО –
становление исследовательского университета мирового уровня,
предпринимательского по типу, ориентированного на интернационализацию всех
направлений деятельности.
Университет ИТМО, 2017
Ю. Н. Матвеев, С. В. Рыбин, 2017
3
1. Программные комплекс Vital Voice Tools
В лабораторных работах используется программный комплекс Vital Voice
Tools (далее VVT), разработанный на базовом предприятии «Центр речевых
технологий». Приложение VVT ‒ это графический интерфейс, предназначенный
для использования и настройки процессора Vital Voice Text-To-Speech (далее
TTS). Программа позволяет синтезировать произвольный текст, сформировать и
редактировать пользовательский словарь, настроить произношение, задать IPA-
транскрипцию для заданных фраз и слов и пр. Приложение VVT состоит из четырех основных частей (модулей):
Модуля синтезатора, позволяющего воспроизводить произвольный
текстовый файл путем произнесения его содержимого при помощи
установленного процессора Vital Voice TTS ‒ движка синтеза.
Модуля редактирования пользовательского словаря, позволяющего
вносить изменения в словарь пользователя и добавлять в него
незнакомые слова, встретившиеся в произносимом тексте.
Модуля настройки пользовательских произношений, позволяющего
пользователю настраивать произношения отдельных фраз путем
модификации транскрипции и управления процедурой подбора
звуковых единиц.
Модуля редактирования словаря IPA-транскрипций, позволяющего для
любого слова задать его транскрипцию, записав ее в виде
последовательности символов международного фонетического
алфавита IPA.