Tts reader как пользоваться

Обновлено: 04.07.2024

Синтезаторы речи способны превратить любой электронный документ в поток звука, который можно прослушать один раз или сохранить на устройстве как аудиофайл. Озвучка текста голосом нашла применение во многих сферах жизни человека, а для людей с ослабленным зрением и нарушением речевой функции она просто жизненно необходима.

Что такое синтезаторы речи

Синтезатор речи — это программное обеспечение, которое превращает текст в голос. Процесс преобразования проходит в несколько этапов:

  1. Подготовка текста: перевод чисел в слова, расшифровка сокращений, разделение на фразы.
  2. Составление фонетической конструкции на основании словарей, встроенных в систему.
  3. Расчет данных для достижения плавного перехода и создания правильной интонации.
  4. Воспроизведение звука.

Синтезаторы речи поддерживают разные языки, что позволяет их использовать в том числе для переводов. С их помощью можно научиться правильно произносить слова на иностранных языках, создавать аудиокниги, озвучивать видеоролики, презентации, документы, а также просто воспроизводить вслух любые тексты на родном языке, если есть проблемы с речью или зрением.

Работа синтезатора занимает доли секунды — стоит только набрать текст, как робот готов прочитать его вслух.

Синтезаторы превращают массивы текста в аудиопоток, воспроизведением которого можно управлять: ставить на паузу, перематывать, менять громкость и скорость чтения.

Популярные голосовые движки

Звучание голоса в синтезаторе речи зависит от того, какой в нем используется движок. Например, в русских версиях Windows установлен “электронный диктор” Microsoft Irina. Если в синтезаторе речи нет другого движка, то по умолчанию будет говорить именно она. При этом выбор голосов на самом деле очень богатый. Среди популярных русских движков можно выделить:

  • Alyona от Acapela Group
  • Татьяна и Максим от Ivona
  • Ольга и Дмитрий от Loquendo
  • Милена, Катерина и Юрий от Nuance
  • Николай от Speech Cube Elan

Движки отличаются тембром голоса, эмоциональной окраской, количеством встроенных словарей, которые определяют правильность речи. Например, Николай читает текст практически без эмоций, поэтому с ним сложно воспринимать художественные тексты, а Ольга и Дмитрий от Loquendo, наоборот, используют разные стили речи. Все перечисленные движки работают по стандарту SAPI 5, который применяется на Windows, начиная с версии XP.

настройки text to speech

Большинство движков представлены в двух вариантах — мужской и женский голос. Детских голосов мало. Даже на сайте Acapela Group, одного из лидеров индустрии, меньше 10 языков, для которых доступны голоса детей.

Как сказано выше, голосовые движки облегчают процесс изучения иностранных языков. Например, Lernout&Hauspie предлагает для этого бесплатные голоса с американским и британским акцентами английского,а также голландским, испанским, итальянским и другим произношением. Большое количество движков разработала компания Cepstral. У них также есть бесплатная версия электронного диктора, однако при ее использовании постоянно появляется окно с предложением перейти на платный тариф.

Чтобы добавить голосовой движок в Windows, достаточно его скачать и установить как обычную программу. После этого он появится в списке доступных. Но для использования голосов необходима сторонняя программа или веб-сервис, так как сами движки не имеют графического интерфейса.

Программы для озвучки текста

Если вам нужно постоянно озвучивать большие объемы текста из электронных документов, то самый удобный вариант — установить специальные приложения, которые умеют работать с файлами разного формата.

Балаболка

Балаболка — бесплатная программа озвучки для Windows от российских разработчиков. Она поддерживает работу с любыми голосовыми движками, установленными в системе. В ее интерфейсе есть стандартные инструменты для управления воспроизведением: пауза, остановка, перемотка, изменение скорости и громкости.

балаболка

«Балаболка» умеет читать вслух текст из буфера обмена, произносить набираемые на клавиатуре фразы, озвучивать содержимое редактора или загруженных в нее файлов в форматах AZW, AZW3, CHM, DjVu, DOC, DOCX, EML, EPUB, FB2, FB3, HTML, LIT, MOBI, ODP, ODS, ODT, PDB, PDF, PPT, PPTX, PRC, RTF, TCR, WPD, XLS, XLSX.

Результат обработки «Балаболка» сохраняет как аудиофайл в форматах WAV, MP3, MP4, OGG и WMA. У нее также есть возможность сохранения текста внутри файлов MP3 для дальнейшего отображения в виде субтитров в медиапроигрывателе.

Govorilka

Govorilka — ещё одна программа для озвучки с минималистичным интерфейсом. Поддерживает голосовые движки устаревшего стандарта SAPI 4, в том числе на иностранных языках.

По умолчанию Govorilka озвучивает текст голосом стандартного движка Microsoft. В ее составе есть инструменты управления, традиционные для программ такого типа: воспроизведение, пауза, остановка, изменение скорости, громкости и высоты голоса. Одновременно в ней можно открыть до 8 вкладок с разными фрагментами текста.

govorilka

Несмотря на простоту и устаревший интерфейс, «Говорилка» всё еще актуальна. Она умеет распознавать текстовые документы в разных форматах объёмом до 2 Гб и сохранять результат обработки в MP3 и WAV.

eSpeak

eSpeak — бесплатная программа для озвучки текста, доступная на Windows, macOS, Linux и Android. Она использует голосовые движки, установленные в системе, а также добавляет к ним несколько своих.

Версия этого приложения для Windows имеет максимально простой интерфейс и управление. Текст, который нужно прочитать, достаточно вставить в поле посредине окна, а затем нажать “Speak”.

Максимальный размер текста здесь явно не определен, но приложение справляется с большими объёмами. Также у него есть возможность читать тексты из файлов с расширением TXT, другие форматы не поддерживаются.

espeak

Для управления скоростью чтения в eSpeak используется ползунок Rate. Если вы хотите сохранить прочитанный текст в аудиофайл, нажмите на кнопку «Save to .wav» и задайте имя записи.

В мобильной версии приложения для Android аналогичная функциональность, разве что нет возможности сохранить текст в аудио.

Acapela TTS

Acapela Group разрабатывает программы для всех популярных операционных систем: Windows, macOS, Linux. Android, iOS. Среди главных достоинств этого софта — поддержка большого количества языков и отличное качество голоса. Мощные движки хорошо обучены и имеют развёрнутую справочную базу, которая позволяет им говорить правильно и выразительно.

Acapela TTS
Alyona Russian

Однако все продукты Acapela коммерческие. Установить приложение на компьютер или телефон можно бесплатно, но без купленного голосового движка в них нет никакого смысла. Стоимость одного пакета — 3,99 евро. Прежде чем оплачивать покупку, вы можете прослушать демо голоса с произвольным текстом, чтобы определить, подходит ли вам такое звучание.

ICE Book Reader Professional

ICE Book Reader Professional

Программа умеет превращать книги в MP3/WAV-файлы. Это значит, что вы можете из любого произведения, доступного в текстовом формате, сделать аудиокнигу.

Скорость преобразования текста в голос в этом приложении увеличивается за счёт одновременного использования нескольких модулей синтеза речи.

Веб-сервисы и расширения для озвучки текста

Для озвучивания небольших фрагментов текста можно обойтись без специальных программ. Веб-сервисы и расширения для браузеров тоже имеют неплохие инструменты синтеза речи с приятными на слух голосами.

Google Переводчик

В составе веб-версии переводчика от Google есть встроенный синтезатор речи, который поддерживает большое количество языков.

Как им пользоваться:

  1. Откройте Google Переводчик.
  2. Вставьте текст.
  3. Выберите язык, если он не определился автоматически.
  4. Нажмите на значок динамика для озвучки добавленного фрагмента.

Google Переводчик

Google Переводчик удобен для изучения иностранных языков. Идеального произношения от него ждать не стоит, но, например, англоязычный голосовой движок даёт неплохое представление о том, как должна звучать английская речь. Русский голос кажется слишком медленным, но читает чисто и без ошибок при расставлении ударений.

Главное достоинство сервиса — моментальное воспроизведение звука. Недостатки тоже есть: например, лимит на размер текста — не более 5000 символов. Кроме того, сервис не имеет настроек голоса — нельзя изменить ни тембр, ни скорость чтения.

From-Text-To-Speech

From-Text-To-Speech позволяет воспроизвести до 50 000 символов за один подход. Принцип его работы аналогичен гугловскому переводчику: вы вставляете в окно фрагмент текста и выбираете язык.

Однако в отличие от Google Translate, на From-Text-To-Speech есть две важные настройки: скорость воспроизведения и голосовой движок. Правда, выбор всё равно небольшой. Скорость чтения здесь устанавливается пресетами Slow (медленно), Medium (средне), Fast (быстро) и Very Fast (очень быстро), а изменение голосового движка доступно не на всех языках — например, на русском можно слушать только Валентину, а на португальском — Rodrigo.

From-Text-To-Speech

Чтобы обработать текст в From-Text-To-Speech, вставьте его в окно и нажмите на кнопку Create Audio File. Продолжительность операции зависит от размера фрагмента. После обработки откроется страница со ссылкой на скачивание аудиофайла. Также можете прослушать текст онлайн, используя встроенный проигрыватель.

скачивание аудио файла после озвучки

From-Text-To-Speech умеет озвучивать только 8 языков. Но если вам нужно прослушать большой фрагмент текста на русском или английском, то этот сервис будет полезнее, чем Google Переводчик.

Zvukogram

zvukogram

По функционалу с голосом вы можете сделать:

  • Ударение на любой букве в слове.
  • Усилить одно слово или целую фразу. Это дает возможность правильно расставить акценты.
  • Повысить или понизить скорость голоса.
  • Изменить настроение голоса.
  • Изменить высоту голоса (сделать грубый или писклявый).
  • Озвучить текст несколькими голосами сразу.
  • Ставить паузы любой длины.

Вы можете загрузить текст любой длины и озвучить его. По окончании озвучки файл можно увидеть в виде волны, прослушать его, сохранить ссылку и скачать в mp3, wav, ogg форматах.

файл в виде волны

Помимо русского доступны английский, немецкий, итальянский, испанский и турецкий языки.

Text-to-Speech

Text-to-Speech предлагает озвучить фрагмент текста до 1000 символов на одном из поддерживаемых языков: русском, английском, итальянском, корейском — всего 23 варианта с учётом гендерной принадлежности голоса. Кроме выбора языка в нем доступно изменение скорости чтения. К сожалению, качество русскоязычного голосового движка оставляет желать лучшего — интонацию трудно воспринимать, часто встречаются ошибки в ударениях.

сервис Text-to-Speech

Обработка текста в Text-to-Speech занимает несколько секунд, после чего на экране появляется аудиопроигрыватель. Отдельной ссылки для скачивания аудио он не формирует, но вы можете кликнуть по проигрывателю правой кнопкой мыши и выбрать опцию «Сохранить аудио как», после чего загрузить озвучку на жёсткий диск.

Oddcast

Oddcast позволяет озвучить текстовые фрагменты на 29 языках разными голосами. На русском здесь есть сразу 3 движка, другие онлайн-сервисы такого выбора не дают. Кроме того, у пользователя Oddcast есть возможность выбрать эффект звучания, например, добавить эхо.

Oddcast

Главный недостаток Oddcast — ограничение текста до 600 символов в демо-версии. Есть вопросы и к качеству голосовых движков: иногда они пропускают неправильные ударения, а числительные и вовсе не склоняются.

Яндекс.Переводчик

Сервис для перевода от Яндекса тоже поддерживает озвучку текста. Однако эта возможность доступна только для десятка наиболее распространённых языков, среди которых русский, украинский, польский, английский, немецкий, итальянский, испанский, французский, корейский, китайский и японский. Кроме того, он позволяет озвучить не более 300 символов, при превышении этого лимита значок воспроизведения становится неактивным.

яндекс переводчик

Acapela

На сайте компании Acapela Group, которая также занимается разработкой голосовых движков, есть раздел с демо-версиями. Здесь можно озвучить всего до 150 символов.

Acapela подкупает огромным выбором поддерживаемых языков и разными вариантами голосов. На русском можно послушать только Алёну, но если вы изучаете английский, французский или немецкий, то получите десяток версий звучания.

Acapela

Расширения для браузеров

Для озвучки текста прямо со страницы любого сайта удобнее использовать браузерные расширения. Например, в Google Chrome и других обозревателях на основе Chromium доступен плагин Reader View. Он переводит страницу в режим чтения, в где также есть функция преобразования текста в аудио.

Воспроизведение начнётся автоматически. Вы можете выбрать язык, голосовой движок, громкость и скорость чтения.

настройки Reader View

На Mozilla Firefox и вовсе не нужно устанавливать расширения — их функциональность поддерживается браузером по умолчанию. Чтобы запустить встроенный синтезатор речи:

  1. Откройте страницу с текстом, который нужно озвучить, и дождитесь её полной загрузки.
  2. Кликните по значку режима чтения в адресной строке браузера.
  3. Перейдите на вкладку «Прочитать вслух».
  4. Выберите голосовой движок и скорость воспроизведения.

синтезатор речи в Mozilla Firefox

У функции Reader View есть ограничения — она работает только на страницах, которые поддерживают режим чтения. Если это не так, то в адресной строке Mozilla Firefox просто не появится соответствующий значок. В таком случае у вас остаётся только вариант с использованием других программ или веб-сервисов для озвучки текста.

Кто бы что не говорил о современном цифровом мире, что бумага скоро вымрет и т.д. — всё-таки книги, на мой взгляд, еще долго будут полезны и актуальны. Наоборот, современные технологии помогают более быстро и легко найти те книги и информацию в них, которая вам нужна.

Сейчас в один планшет, кстати говоря, можно загрузить целую библиотеку, и знакомиться с ней в любом месте, например, по дороге на работу, дома, на учебе и т.д.!

Но есть и еще один плюс, что дает нам современное ПО — это возможность слушать книги , так как будто бы их вам читает живой человек (такие программы, кстати, называют синтезаторами речи ) ! Современные голосовые движки позволяют слушать текст в мужском, женском, детском голосах. Обо всем, более подробно ниже.

ускорение ПК

Синтезаторы речи: что выбрать

Для телефона

Синтезатор речи Google

Настройки Android 10 - язык и ввод

Настройки Android 10 - язык и ввод

Что касается использования — то при помощи него вы сможете озвучивать тексты:

  1. в Google Play Книгах;
  2. в Google Переводчике (причем, можно слушать и иностранный текст/слова);
  3. во многих приложениях-читалках, которые вы можете загрузить с Play Market и его аналогов (разумеется, что в настройках приложения нужно будет не забыть указать нужный вам синтезатор).

Voice Aloud Reader

Весьма добротное приложение, способное читать текст из самых разных источников: веб-страниц, статей (документов), электронные письма, SMS, PDF, FB2, MOBI, и т.д.

Voice Aloud Reader — скрины работы приложения

Voice Aloud Reader — скрины работы приложения

Пользоваться приложением крайне легко и удобно: загружаете на телефон нужный документ, добавляете его в библиотеку Voice Aloud Reader, открываете и запускаете чтение. Всё!

Кстати, при желании можно использовать сразу несколько голосов (для этого нужно установить хотя бы пару разных синтезаторов: Acapela, Ivona Google TTS, SVOX TTS и др.). Всё это добро есть на Play Market.

TTS Reader (для книжек)

Универсальная программа для чтения книг (поддерживает форматы: TXT, FB2, PDF, DJVU, EPUB, RTF, HTML и др.).

Мне она больше всего нравится своей библиотекой: во-первых, у вас все книги будут отсортированы (и вы легко найдете нужную), а, во-вторых, вы можете прямо в программе искать новые книжки. Удобно?!

Как запустить чтение в слух! TTS Reader

Как запустить чтение в слух! TTS Reader

Кстати, если вам будет нужно прерваться и остановить чтение — в TTS Reader реализованы удобные закладки (т.е. вы всегда сможете продолжить с того места, где остановились).

Онлайн-сервисы

Весьма интересное решение от Яндекс позволяет озвучивать текст длинной в 5000 символов голосом Алисы. Отмечу, что несмотря на небольшой объем — само качество чтения весьма достойное: их движок хорошо делает интонации и ставит неплохо ударения.

Yandex SpeechKit — скрин с офиц. сайта

Yandex SpeechKit — скрин с офиц. сайта

Конечно, этот сервис не позволит прочитать целую книгу, но если вам нужно знакомится с какой-то статьей фоном — то почему нет.

Не многие обращают внимание, что помимо основной своей функции, онлайн-переводчики могут быть использованы для чтения небольших текстов (Яндекс в этом плане предпочтительнее, т.к. поддерживает до 10 тыс. символов).

Скриншот с сайта Google

Скриншот с сайта Google

Бесплатно : только 300 символов (т.е. маленький текст)

Acapela — чтение моей статьи

Acapela — чтение моей статьи

Этот сервис, на мой взгляд, больше подходит тем, кто изучает иностранные языки. Он позволяет зачитывать вслух тексты как на русском, так и на английском, немецком, итальянском и др. языках.

Кстати, качество чтения у него всё-таки пониже, чем у вышеперечисленных решений.

Скриншот с главной странички сайта

Скриншот с главной странички сайта

Для ПК/ноутбука (под Windows) ✌

Программы для чтения

( прим. : для чтения текста)

Govorilka

Совсем небольшая программа, предназначенная для чтения текстов голосом. Программа может прочитать текст на различных языках, в зависимости от того, какой голосовой движок подключите. Дает возможность создания MP3 файлов (например, создавать аудиокниги, так популярные в последнее время).

Главное окно программы "Говорилка"

  1. чтение текста из различных файлов: DOS и Windows кодировке; читаемый текст может быть размеров в 2 ГБ; открывает файлы Word, Html;
  2. возможность регулировать скорость чтения, высоту голоса, громкость и пр.;
  3. возможность записывать читаемый текст в формат MP3 (кстати, записывать можно с повышенной скоростью);
  4. программа автоматически перелистывает странички (текст) книги по мере чтения (и показывает его вам);
  5. есть возможность корректировать отдельные слова и словосочетания, как их нужно правильно проговаривать;
  6. при закрытии программы - она автоматически запоминает последнюю позицию курсора;
  7. полностью на русском языке, работает во всех современных версиях Windows 7, 8, 10.

Demagog

Эта программа 2 в 1: это и текстовые редактор с поддержкой Юникода, и синтезатор речи (т.е. софт для озвучивания текста) с поддержкой SAPI4 / SAPI5 (прим.: о движках см. во второй части статьи). Программа отличается от многих своих конкурентов, т.к. при ее разработке были использованы специальные алгоритмы словарных замен, которые сказываются на правильности произношения читаемого текста. Так же в Demagog реализована бессловарная проверка орфографии.

Demagog - пример чтения // главное окно

Основные возможности программы:

  1. чтение текстов из различных форматов: MS Word, E-Book и HTML (поддержка импорта рисунков);
  2. возможность записи аудиофайлов в форматы: WAV, MP3, OGG, WMA, MP4;
  3. возможность подключения пользовательских аудиокодеков;
  4. подсветка орфографических ошибок;
  5. поддержка словарей произношения (формат DIC), возможность их редактирования;
  6. поддержка русского языка на 100%;
  7. работает в OS Windows XP, Vista, 7, 8, 10 (32/64 bits).

Balabolka

Основное предназначение программы "Балаболки" — это чтение "живым человеческим" голосом текстов книг, документов и т.д. Для чтения могут использоваться любые голосовые движки, которые установлены у вас на ПК.

  1. помимо "обычного" чтения (как умеют другие утилиты), "Балаболка" может читать текст из буфера обмена, показывать текст из различных документов, произносить набираемый на клавиатуре текст;
  2. поддерживает просто огромное число форматов файлов: AZW, AZW3, CHM, DjVu, DOC, DOCX, EPUB, FB2, HTML, LIT, MOBI, ODT, PDB, PDF, PRC, RTF, TCR, WPD;
  3. может проверять орфографию, делить большие документы на несколько маленьких, искать омографы;
  4. текст можно сохранить в формате аудиофайла форматов: WAV, MP3, MP4, OGG и WMA;
  5. умеет работать с пакетами от Microsoft Speech API (SAPI);
  6. можно изменять скорость и тембр речи;
  7. полная поддержка русского языка;
  8. ОС: Microsoft Windows XP/Vista/7/8/10.

ICE Book Reader

ICE Book Reader — это одна из самых мощных программ для чтения текстов (как в слух, так и просто с экрана ПК). Одно из главных достоинств: программа бережет ваше зрение, давая возможность настроить отображение текста из книги так, чтобы вам было максимально удобно (размер шрифта, отступы, цвет и т.д. - десятки всевозможных параметров).

ice-book-reader-primer-otkryitoy-knigi

Пример чтения книги

Что касается чтения книг вслух за пользователя - то ICE Book Reader это, разумеется, умеет делать (иначе бы я не включил ее в обзор). Поддерживает голосовые движки SAPI4 и SAPI5.

Кроме чтения, может создавать MP3/WAV файлы из книги (которые затем можно прослушать на любом MP3 плеере). При создании MP3 книг, кстати, не нужно хранить WAV файлы большого размера - программа на лету конвертирует их в MP3. Кстати, благодаря мульти-поточному ядру, программа может очень быстро создать аудиокнигу: несколько модулей синтеза речи (SAPI) могут одновременно "наговорить" на целую книгу.

Ну и последнее, ICE Book Reader позволяет навести порядок на жестком диске с книгами: способа управлять информацией 250000 книг! Программа работает во всех популярных версиях Windows: XP, 7, 8, 10.

Говорун

Простая и надежная программа, построенная на технологии MS Agent 2.0. Для синтеза речи может использовать любые SAPI-движки, которые есть в вашей системе. Дизайном программа не блещет, зато выполнена достаточно оригинально (скрин ниже). Да и программа достаточно многофункциональна (так что это тот случай, когда делать выводы по первому взгляду - преждевременно!).

Говорун - чтение текста

  1. читает и сохраняет форматы файлов: TXT, RTF (можно подготовить в любой версии Word);
  2. возможность работы с командной строкой;
  3. возможность интеграции в проводник, чтобы читать текст по правому клику по файлу (поддерживается только Win 98/ME, NT, 2000, XP);
  4. есть встроенный плеер медиа-файлов;
  5. в программу встроены анекдоты, афоризмы, юмор и пр. - никогда не даст заскучать;
  6. воспроизводимую речь можно записать в WAV-файл;
  7. программу можно настроить по себя: цвет, дизайн, шрифты и пр.;
  8. на русском языке, работает в Windows XP, 7, 8, 10.

RussAcc

Очень быстрая и удобная программа для чтения вслух текстов и созданий аудиокниг (форматов много, особенно по сравнению с аналогичным софтом: wav, mp3, amr, aac). Кроме этого, программа позволяет правильно расставлять ударения в текстах и читать книги с экрана ПК. В программу встроен редактор и любой воспроизводимый ей текст - вы можете редактировать.

Главное окно программы // RussAcc

В настройках программы можно задать размер шрифта, указать цвет, которым выделять читаемый кусок. Можно указать и настроить параметры записи MP3: битрейт, кол-во бит и пр.

RussAcc поддерживает и работает со всеми популярными звуковыми движками. В своей же базе у программы для каждого слова есть особые его формы с ударениями в различных ситуациях (более 3 миллионов форм!).

Кстати, RussAcc поддерживает такой популярный формат электронных книг, как fb2 (а также может его конвертировать в обычный txt-файл). Поддерживает русский язык, совместимы с новыми ОС Windows 7, 8.1, 10.

Голосовые движки: мужские и женские

Движки синтеза речи — это специальное ПО, своего рода драйвера, необходимые для того, чтобы компьютер мог "заговорить" (т.е. для преобразования текста в речь). Движков сейчас в сети сотни: есть как платные, так и бесплатные. Наилучшее качество чтения, конечно же, показывают платные движки.

Важное замечание : движок синтеза речи не имеет никакого дизайна или интерфейса. После его установки в систему — вы не заметите ровным счетом никаких изменений! Чтобы работать с движком — вам нужна какая-нибудь программа для чтения текстов: Балаболка, Говорун, Ice Reader и пр., чуть выше я приводил те, которые "мне по душе" ✌).

Вот поэтому, кстати, часто пользователи ругают ту или иную программу, что она не может прочитать русский текст (или вообще не может). Просто они забывают о необходимости установки речевого движка.

Пару слов про стандарты.

Голосовые движки могут быть выполнены в разных стандартах (так называемых), самые основные три: SAPI 4, SAPI 5 или Microsoft Speech Platform (примечание: почти в каждой программе для чтения, вы можете выбрать речевой движок).

Добротный стандарт, был актуален десяток лет назад. На сегодняшний день устарел, и на современных компьютерах/ноутбуках его использование не оправдано.

Почти все современные голосовые движки построены на этом стандарте (как платные, так и бесплатные). Наиболее популярный стандарт, можно найти движок с мужским, женским, детским голосами.

Microsoft Speech Platform

Microsoft Speech Platform – большой набор инструментов для разработчиков, которые позволяют реализовывать возможность преобразования текста в речь.

это набор инструментов, позволяющих разработчикам различных приложений, реализовывать в них возможность преобразования текста в голос.

Примечание! Чтобы синтезатор речи работал, необходимо:

Microsoft Speech Platform - Runtime – серверная часть платформы, предоставляющая API для программ;
Microsoft Speech Platform - Runtime Languages – языки для работы серверной части.

Несколько голосовых движков

Тext-to-speech engines Дигало // Николай

Очень популярный русский голосовой движок (голос мужской!). Подойдет для большинства программ, которые умеют читать текст голосом. На мой скромный взгляд, один из лучших общедоступных движков для синтеза речи (на русском языке). Кроме русского, кстати, на сайте разработчика доступны движки еще для нескольких языков. Минус : без регистрации работает всего две недели.

Acapela // Голосовой движок (модуль) Алена

Алёнка - относительно новый русский женский речевой движок от компании Acapela. Работает по стандарту SAPI-5 с частотой 22 КГц. Некоторые пользователи считают, что голос у "Алены" приятнее, чем у "Николая".

Голосовой движок (модуль) Катерина 2

Компания разработчик: ScanSoft RealSpeak

Довольно неплохой речевой движок с женским голосом. После доработки движка, он стал сопоставим с "Николаем". Существенному обновлению подверглась фонетическая база движка, изменен алгоритм постановки ударений (что положительно сказалось на звучании), устранена проблема со скоростью произношения.

RHVoice

RHVoice — это многоязычный синтезатор речи с открытым исходным кодом. Можно использовать в ОС Windows и Linux. Синтезатор совместим с SAPI5. Разработчик синтезатора — Ольга Яковлева.

Кстати, движок основан на речевой базе, записанной дикторами. Русские голоса "Елена" и "Ирина" доступны для скачивания на официальном сайте.

IVONA Tatyana/Maxim

Очень интересные молодые голосовые движки (их 2: мужской и женские голоса). Многие считают голос Татьяны одним из лучших (если не самым лучшим!). По ссылке выше, можно заслушать как будут звучать ваши тексты, так сказать, портфолио (на мой взгляд, очень приятно звучат).

Станет ли движок самым используемым — не знаю, время покажет!

Кстати, как думаете, будет ли когда-нибудь разработан речевой движок, который не отличишь от голоса обычного человека? Или может он уже есть, а я о нем не слышал. (скиньте название!)

Озвучка книг синтезатором речи на андройд Синтез речи, Книги, Аудиокниги, Android

Лет 7 назад побывал пользоваться синтезатором речи для озвучки книг, но полностью разочаровался в этом, и вот чуть меньше года назад наконец то столкнулся с приемлемым синтезатором речи и сегодня решил поделиться, на нем я "прослушал" около 50 книг и все устраивает.

Есть словари для правильного произношения и настройка тембра/амплитуды/скорости голоса

Это сборка состоит из синтезатора речи VokaliserExpressive2 версии 1.0.2.3t2 и голосов Milena ,Катерина и Юрий PremiumHigh версии .

В сборке присутствует словарь созданный DamionSleeper от 12.07.2017

Распаковываем архив.Копируем папку VocalizerEx2 в корень SD карты. Должно получится SD-карта\VocalizerEx2

* Не ищите VocalizerEx2 TTS в приложениях. Это сервис, такой же как Google TTS. В приложениях он не появится.

На Андроиде заходим в "Настройки синтеза речи" и выбираем VocalizerEx2 TTS как TTS по умолчанию.

В настройках VocalizerEx2 откройте "Папка с голосами". Найдите папку VocalizerEx2 и выберите её.

Перезапустите VocalizerEx2.Для этого просто смените TTS на любой другой,уже установленный ранее и после выберите опять VocalizerEx2.

Если другие синтезаторы речи у вас отсутствуют то просто перегрузите смартфон

Нажимаем прослушать пример.

В любой современной читалке для андройд есть функции TTS - просто назначите действие для начала синтеза речи.

от спасибо, схоронил, давно интересовался этой штукой

Я человек простой, увидел "андройд" - поставил минус.


Роман Суржиков - "Полари". Новое фентези, по которому все сойдут с ума

Всем привет, меня зовут Кирилл Головин и я озвучиваю книжки.

Буквально вчера, в процессе озвучки очередного рассказа из серии "Полари", за авторством писателя Романа Суржикова, подумал о том, насколько же крутая это серия. Нет, я и раньше знал об этом, но почему-то именно вчерашний рассказ навёл на мысль о том, что, возможно, "Полари" - это именно те книжки, которые вернут доверие читателя к русскоязычным фентези-авторам.

Удивительно, что в эпоху бесконечных ЛитРПГ-квестов, попаданцев и попыток переплюнуть популярные Grimdark-истории, Роман сумел создать по-настоящему уютный, даже "домашний" мир, в который каждый раз возвращаешься не просто с удовольствием, но с нетерпением. И это говорит вам человек, который за год читает под сотню разнообразных книг и повестей фантастической и фентези тематики.

В "Полари" вы не найдёте кровавой жестокости, тёток в бронелифчиках (и без оных), невероятной магии и волшебных существ. Зато здесь есть по-настоящему запутанный сюжет, с интригой, которая держит на протяжении вот уже четырёх толстенных книг и пачки DLC, запоминающиеся герои, причём и главные, и второстепенные, прекрасный умный язык повествования и, конечно же, крутейшие концовки.

"Полари" - это книжки для любителей погрузиться в чтиво/прослушивание с головой. История немного раскачивается поначалу, неторопливо знакомя читателя/слушателя с героями, окружением, манерой повествования. Все актёры надевают свои маски, злодеи прячутся за вуалями, пока читатель неторопливо едет в повозке купца Хармона Паулы, знакомясь с окружением, а потом.

Потом всё это просто взрывается. Ставочки возрастают буквально за несколько глав и вот ты уже дрожишь от холода вместе с запертым в темнице купцом Хармоном, который стаскивает одежду с обветшалого скелета, чтобы не околеть. Стиснув зубы чувствуешь едкую боль гноящейся раны Эрвина. Гадаешь изо всех сил над змеиным клубком, который пытается распутать Минерва. И это только самое начало. История становится лучше с каждой последующей книгой.

К чему это я распинаюсь? Конечно же, мне очень нравится "Полари". Я вижу, что этот цикл по душе моим слушателям, пользователям "Фантлаба", которые выдали ему две подряд "книги года", а также признанным мэтрам жанра, например Алексею Пехову, который в своём отзыве написал о "Полари": "Одна из лучших вещей, что я прочел в 2021". Всё это наталкивает меня на мысль, что, когда цикл будет закончен, а это непременно произойдет, и книги доберутся до массового читателя, мы можем ожидать настоящий бум популярности, возможно, не только среди русскоязычных читателей.

Поэтому, если вы вдруг еще не знакомы с "Полари", и располагаете порядочным количеством времени и желания на чтение/прослушивание, добро пожаловать в удивительный мир рыцарства и доблести, заговоров и интриг, невероятных технологий и традиций, пока это не стало мейнстримом

Александр

Александр Кузнецов | 23 Декабря, 2020 - 17:55

Text To Speech

Современный человек перегружен информацией и делами, и иногда у нас нет времени, чтобы прочитать какую-нибудь интересную статью, особенно если она длинная. Приходится откладывать чтение на потом, но далеко не факт, что вы вспомните о ней.

Удобный вариант — добавить в браузер расширение, которое озвучит текст статьи голосом в то время, когда вы занимаетесь каким-нибудь делом. Само собой, нужно расширение с поддержкой русского языка.

Как добавить синтезатор речи в браузер?

Если вы используете Chrome, Firefox или Opera, установите расширение Intelligent Speaker. Оно поддерживает два десятка языков, включая русский, и автоматически озвучивает текст на веб-странице.

Intelligent Speaker

В очередь можно добавить несколько ссылок, тогда расширение будет последовательно читать вам текст с каждой из этих страниц. Также можно загрузить в него текстовый файл в формате.pdf, .txt или.docx — текст будет распознан и озвучен. Озвученный текст можно скачать в формате.ogg, который воспринимается большинством плееров.

В расширении есть перемотка для быстрого перехода к разным фрагментам текста, кнопка паузы для приостановки чтения и настройки скорости чтения от 0,8x до 2x. Не хватает только выбора голоса, есть только женский, и робот иногда коверкает слова или неправильно ставит ударения, чем усложняет восприятие текста. Недостаток этого расширения в том, что в месяц можно бесплатно слушать всего один час озвучки текста, а затем надо оформлять платную подписку.

Читайте также: