Настройка синтеза речи в ubuntu

Обновлено: 03.07.2024

Festival - это система синтеза речи, которая поддерживает множество языков и работает под Linux. Иначе говоря, "говорилка". Разработана в Исследовательском Центре Речевых Технологий (CSTR) Эдинбургского университета. Собственно, кроме Festival других вменяемых "говорилок" для Linux я не встречал. Так что выбирать не приходится. Качество синтеза чуть хуже, чем у других синтезаторов речи под Windows или Android, но достаточно приемлемое, чтобы слушать. Русский язык поддерживается. Распространяется под свободной лицензией BSD, что несомненное преимущество перед платными аналогами.

В Ubuntu Linux 18.04 LTS установка теперь происходит без каких-либо проблем из основного репозитория:

sudo apt-get install festival festvox-ru

В прошлом приходилось самому "колдовать" с установкой и настройкой русского движка "msu_ru_nsh_clunits". Теперь такой проблемы нет. После установки мы получаем работоспособную систему.

Приведу некоторые команды, которыми я пользовался.

Запуск программы в терминале:

festival

Смена голосового движка:

festival> (voice_msu_ru_nsh_clunits) - Русский.

festival> (voice_kal_diphone) - Английский американский.

Произнести текст (смотрите, чтобы движок соответствовал вводимому языку):

festival> (SayText "say text")

Команды можно вводить и непосредственно из терминала. festival -b '(begin (voice_msu_ru_nsh_clunits) (SayText "сказать текст"))' Прочитать текст из текстового файла в терминале: festival -b '(begin (voice_msu_ru_nsh_clunits) (tts_file "/home/lookolovka/test.txt"))' Внимание! Ударения в тексте можно указывать символом "+". cat test.txt | text2wave > test.wav -eval '(voice_msu_ru_nsh_clunits)' Можно самому задать битрейт wav-файла, например битрейт 8000 Hz: cat test.txt | text2wave > test.wav -eval '(voice_msu_ru_nsh_clunits)' -F 8000

1 комментарий:

VarangaOfficial - варанга цена и отзывы - мы работаем только с официальными источниками, и предоставляем вниманию наших пользователей исключительно проверенные, не подвергающиеся сомнениям, факты. Воспользовавшись нашим ресурсом, вы получите возможность узнать подробную информацию касательно этого натурального лекарственного комплекса. Лично увидеть данные о проведенных клинических исследований, прочесть реальные отзывы пациентов и врачей. Изучить инструкцию по применению, прочитать особенности и методы работы мази, уяснить, как работает крем Варанга, где можно купить сертифицированный, оригинальный препарат и, как не нарваться на подделку. Мы очень тщательно и скурпулезно проверяем размещаемые данные. Предоставляем пользователям нашего ресурса сведения, взятые исключительно из надежных источников. Если вы обнаружили признаки развития грибка или же долго и безрезультатно стараетесь избавиться от этого коварного, неприятного недуга, наш сайт покажет вам легкий и быстрый способ устранения проблемы. Присоединяетесь и живите полноценной, здоровой жизнью. Теперь все ответы на самые популярные и волнующие пользователей вопросы, собраны на одном ресурсе.

Ведь работать данная заметка будет в паре с сервисом личной настройки своего «Умного Дома» на базе MajorDoMo. А как поставить MajorDoMo на Ubuntu 18.04 Server смотрите здесь (), я ведь использую только самолично настроенное, а не готовые сборки не пойми кого, чтобы не задавать на профильных ресурсах вопросы, у меня это не работает, почему?

$ sudo apt-get install scons gcc git flite flite1-dev expat libunistring-dev libsox-dev libpulse-dev libao-dev build-essential libc6-dev g++-multilib -y

Cloning into '/usr/src/rhvoice'.

remote: Enumerating objects: 9154, done.

remote: Total 9154 (delta 0), reused 0 (delta 0), pack-reused 9154

Receiving objects: 100% (9154/9154), 316.04 MiB | 2.69 MiB/s, done.

Resolving deltas: 100% (5302/5302), done.

Checking out files: 100% (1345/1345), done.

ekzorchik@srv-bionic:/usr/src/rhvoice$ sudo scons

ekzorchik@srv-bionic:/usr/src/rhvoice$ sudo scons X11=no

ekzorchik@srv-bionic:/usr/src/rhvoice$ sudo scons install

ekzorchik@srv-bionic:/usr/src/rhvoice$ sudo ldconfig

ekzorchik@srv-bionic:/usr/src/rhvoice$ cd

Звуковые профили голоса: /usr/local/share/RHVoice/voices/
Конфигурационный файл: /usr/local/etc/RHVoice/RHVoice.conf
Файлы голосового движка: /usr/local/share/RHVoice/
Звуковые профили на иностранных языках: ekzorchik@srv-bionic:

English Esperanto Georgian Kyrgyz Russian Tatar Ukrainian

alan anatol azamat clb irina natia slt talgat

aleksandr anna bdl elena natalia nazgul spomenka

$ sudo nano /usr/local/etc/RHVoice/RHVoice.conf

; Список голосовых профилей. Первым в профиле указывается основной

; голос (он будет читать числа и другой текст, для которого не удаётся

; автоматически определить язык). Далее следуют дополнительные

; голоса. Если в профиле заданы два голоса, чьи языки имеют общие

; буквы, то второй будет использоваться только в том случае, когда

; программа экранного доступа специально запросит использование

Чтобы проверить работу офлайного голосового движка RHVoice я сперва разверну Ubuntu 18.04 Server внутри Virtualbox на основной системе Ubuntu 18.04 Desktop ноутбука Lenovo E555, т. к. у меня уже был успешный опыт работы аудио под Virtualbox, подробнее смотреть заметку:

$ sudo apt-get install alsa alsa-tools lame -y

$ sudo adduser ekzorchik audio

Adding user ekzorchik' to group audio' .

Adding user ekzorchik to group audio

aplay: device_list:270: no soundcards found.

**** List of PLAYBACK Hardware Devices ****

card 0: Intel [HDA Intel], device 0: STAC9221 A1 Analog [STAC9221 A1 Analog]

card 0: Intel [HDA Intel], device 1: STAC9221 A1 Digital [STAC9221 A1 Digital]

$ lspci -v | grep Audio

00:05.0 Audio device: Intel Corporation 82801FB/FBM/FR/FW/FRW (ICH6 Family) High Definition Audio Controller (rev 01)

Subsystem: SigmaTel 82801FB/FBM/FR/FW/FRW (ICH6 Family) High Definition Audio Controller

$ sudo nano /etc/modules

$ sudo modprobe -r snd_intel8x0

$ sudo modprobe snd_intel8x0

$ sudo lsmod | grep snd_intel8x0

snd_intel8x0 40960 0

snd_ac97_codec 131072 1 snd_intel8x0

snd_pcm 98304 5 snd_hda_intel,snd_hda_codec,snd_hda_core,snd_ac97_codec,snd_intel8x0

snd 81920 9 snd_hda_intel,snd_hwdep,snd_hda_codec,snd_hda_codec_idt,snd_ac97_codec,snd_timer,snd_intel8x0,snd_hda_codec_generic,snd_pcm

Теперь настал момент проверки работы аудиовоспроизведения под Virtualbox в текущей гостевой системе — Ubuntu 18.04 Server

$ sudo apt-get install moc -y

Копирую с основной систему в гостевую аудио файл для проверки воспроизведения:

$ scp /media/ekzorchik/own/02\ Midnight\ Rider.mp3 ekzorchik@172.33.33.25:/home/ekzorchik

02 Midnight Rider.mp3 100% 7442KB 26.0MB/s 00:00

Запускаю на гостевой системе проигрыватель и указываю на звуковой файл:

$ mocp 02\ Midnight\ Rider.mp3
Running the server.
Trying JACK.
Trying ALSA.

И аудио файл проигрывается из Ubuntu 18.04 Server amd64 основной системы Ubuntu 18.04 Desktop amd64 ноутбука Lenovo E555.

Так, а теперь проверяю, как будет работать офлайновый голосовой движок RHVoice установленный выше по заметке в текущую систему Ubuntu 18.04 Server amd64:

$ echo "Алиса, включи освещение в доме?" | RHVoice-test -t 1 -p Elena

default Engine is default

Воспроизведения не последовало.

Но не суть — это был эксперимент, никто и не надеялся, что под виртуализацией заработает проброс аудио как раньше.

Оформил данную заметку как скрипт, загрузил его к себе в Mercurial репозитарий, затем установил из него на основную систему Ubuntu 18.04 Desktop ноутбука Lenovo E555 и пробую как работает RHVoice:

$ echo day | RHVoice-test

default Engine is default

слово «day» воспроизвело.

А теперь с использование голосового профиля диктора:

$ echo "Алиса, включи освещение в доме?" | RHVoice-test -t 1 -p Elena

default Engine is default

Вполне себе ничего, стоит поиграться с настройками не будет такого отличительного металлического произношения.

Итого получается работоспособная заметка по установке RHVoice на Ubuntu 18.04 Server/Destkop

На этом у меня все с уважением автор блога Олло Александр aka ekzorchik.

Используйте прокси ((заблокировано роскомнадзором, используйте vpn или proxy)) при использовании Telegram клиента:

Поблагодари автора и новые статьи

будут появляться чаще :)

Карта МКБ: 4432-7300-2472-8059

Большое спасибо тем кто благодарит автора за практические заметки небольшими пожертвованиями. С уважением, Олло Александр aka ekzorchik.

Основная задача этого блога, показать как работать в Ubuntu комфортно и с удовольствием!

Search form is empty!

0 коммент.:

Like us on Facebook

Labels

Архив блога

Flickr Images

Video of the Day

Most Trending

В следующей статье мы рассмотрим eSpeak. Это о синтезатор речи для английского и других языков что мы можем использовать в Ubuntu. В следующих строках мы увидим, как установить его в Ubuntu 18.04.

Этот инструмент для командной строки принимает входные данные в виде текстовой строки, входного файла и STDIN проиграть его голосом, сгенерированным компьютером.

Установка ESpeak на Ubuntu

Мы найдем этот инструмент доступны в официальных репозиториях Ubuntu. По этой причине его установка проста из терминала (Ctrl + Alt + T). В нем нам нужно будет только начать с обновления индекса доступных пакетов, набрав:

После обновления мы готовы к установить eSpeak. Для этого нам достаточно будет написать в том же терминале:

После установки мы сможем проверьте номер версии приложения, в то же время мы также проверим, что он был правильно установлен в системе. Сделаем это, написав команду:

Используйте eSpeak для преобразования текста в аудио

С помощью утилиты eSpeak мы сможем легко прослушать определенный текст. Мы можем сделать это тремя простыми способами. Первый будет использовать следующую команду для прослушать текст, указанный в кавычках:

Мы также сможем введите следующую команду и нажмите Главная:

Теперь нам просто нужно напишите текст, который мы хотим, чтобы eSpeak читал вслух. После его написания остается только нажать Главная.

В этом случае мы можем добавить столько строк текста, сколько захотим. Для выхода из утилиты нажмите комбинацию клавиш Ctrl + C.

Один из самых полезных способов использования этого приложения - возможность прослушать содержимое текстового файла. Вам просто нужно использовать следующий синтаксис, чтобы указать текстовый файл, который вы хотите услышать вслух:

В дополнение к указанным, мы можем найти другие способы использования этого приложения. Мы можем использовать следующую команду, чтобы просмотреть справку по инструменту и сообщите нам:

Или мы также можем использовать документация которые мы найдем на сайте проекта.

Hyper, эмулятор терминала, созданный с использованием веб-технологий

Графический интерфейс под названием Gespeaker

Gespeaker - это бесплатный интерфейс GTK + для espeak, даже если мы решим установить этот интерфейс, нам не потребуется устанавливать espeak. Позволит нам воспроизвести текст на многих языках с настройками голоса, высоты звука, громкости и скорости. Прочитанный текст также можно записать в файл WAV для дальнейшего прослушивания. Этот инструмент предназначен для пользователей, которые не хотят использовать командную строку.

У нас будет возможность установить это программное обеспечение через пользовательский интерфейс Ubuntu простым способом. Для начала у нас не будет больше, чем открыть вариант программного обеспечения Ubuntu. Мы щелкнем значок увеличительного стекла, и мы написать 'говорящий'в строке поиска. Результаты покажут нам примерно следующее:

Отсюда мы сможем установить этот инструмент. Если вы хотите использовать командную строку для установки того же приложения, вам просто нужно использовать следующую команду в терминале (Ctrl + Alt + T):

После установки мы можем искать лаунчер на нашем компьютере:

Пользовательский интерфейс Gespeaker довольно прост. Не должно возникнуть проблем с тем, чтобы понять, как конвертировать наши текстовые и текстовые файлы в аудио. Чтобы получить желаемый результат, помимо элементов управления, которые мы найдем в интерфейсе программы, мы также можем настроить их свойства.

Более подробную информацию об этом проекте можно получить на сайте Ваш сайт.

Удалить eSpeak

Если вы хотите удалить eSpeak, мы можем сделать это с помощью следующей команды в терминале (Ctrl + Alt + T):

Независимо от того, являетесь ли вы пользователем терминала или предпочитаете пользовательский интерфейс, проблем быть не должно, когда дело доходит до преобразовать текст в аудиовыход благодаря eSpeak или Gespeaker.

Содержание статьи соответствует нашим принципам редакционная этика. Чтобы сообщить об ошибке, нажмите здесь.

Полный путь к статье: Убунлог » Ubuntu » eSpeak, преобразование текста в речь из терминала Ubuntu

Читайте также:

Настройка синтеза речи в ubuntu

1 комментарий:

0 коммент.:

Popular Posts

Like us on Facebook

Labels

Архив блога

Flickr Images

Video of the Day

Most Trending

Установка ESpeak на Ubuntu

Используйте eSpeak для преобразования текста в аудио

Графический интерфейс под названием Gespeaker

Удалить eSpeak