Microsoft server speech platform runtime x64 что это

Обновлено: 07.07.2024

Microsoft Speech Platform - набор инструментов, позволяющих разработчикам строить решения с распознаванием голоса и перевода голоса в текст. Текущая версия 11.0 платформы предлагает голоса для 26 языков, включая русский.

Для работы синтезатора речи необходимо загрузить и установить следующие компоненты Microsoft Speech Platform:

Microsoft Speech Platform - Runtime – серверная часть платформы, предоставляющая API (набор функций) для программ (файл с именем "SpeechPlatformRuntime.msi" для 32-битных и 64-битных версий Windows).
Microsoft Speech Platform - Runtime Languages – набор языков для серверной части. Для каждого языка доступны для скачивания модули для распознавания речи (файлы, чьи имена начинаются с "MSSpeech_SR_") и компьютерные голоса (файлы, чьи имена начинаются с "MSSpeech_TTS_").

В списке голосов присутствует и русский голос Elena (файл с именем "MSSpeech_TTS_ru-RU_Elena.msi", размер 6 МБ). Качество звучания синтезатора речи - очень посредственное; голос делает много ошибок в ударениях. (Такая же ситуация, кстати, и с немецким голосом: носитель языка, который послушал этот голос, сообщил о большом количестве ошибок в произношении немецких слов.)

Хотя на сайте Microsoft сказано, что платформа поддерживает только Windows Vista, Windows Server 2008 и Windows 7, тем не менее голоса для европейских языков будут работать и на Windows XP. Голоса для азиатских языков (китайский, корейский, японский) будут работать на Windows Vista и выше.

Для голосов Microsoft Speech Platform можно использовать те же теги, что и для голосов SAPI 5. Однако, теги смены голоса ("Voice" и "Lang") позволяют переключаться лишь между голосами платформы. То есть, нельзя при чтении одного текста задействовать голоса SAPI 5 и голоса Microsoft Speech Platform одновременно.

В остальном голоса Microsoft Speech Platform также имеют много сходного с голосами SAPI 5. Возникает вопрос: зачем нужно было создавать Microsoft Speech Platform? Почему вместо, например, 6-ой версии SAPI мы получили лишь набор голосов с низким качеством звучания, да еще и не совместимых с SAPI 5? То есть, это не то что не "SAPI 6" - это даже не "SAPI пять-с-половиной".

Ответ будет таков: Microsoft Speech Platform создавалась с конкретной прикладной целью - объединить воедино распознавание и синтез речи. Главное здесь - это реализация поддержки языка VoiceXML; с помощью этого языка машина и человек смогут "общаться" друг с другом.

Информацию о VoiceXML можно найти здесь:

Статья о VoiceXML в Википедии
Описание VoceXML на сайте W3C
Руководство для разработчиков по VoiceXML

Кто бы что не говорил о современном цифровом мире, что бумага скоро вымрет и т.д. — всё-таки книги, на мой взгляд, еще долго будут полезны и актуальны. Наоборот, современные технологии помогают более быстро и легко найти те книги и информацию в них, которая вам нужна.

Сейчас в один планшет, кстати говоря, можно загрузить целую библиотеку, и знакомиться с ней в любом месте, например, по дороге на работу, дома, на учебе и т.д.!

Выбираем программу для чтения

Совсем небольшая программа, предназначенная для чтения текстов голосом. Программа может прочитать текст на различных языках, в зависимости от того, какой голосовой движок подключите. Дает возможность создания MP3 файлов (например, создавать аудиокниги, так популярные в последнее время).

Эта программа 2 в 1: это и текстовые редактор с поддержкой Юникода, и синтезатор речи (т.е. софт для озвучивания текста) с поддержкой SAPI4 / SAPI5 (прим.: о движках см. во второй части статьи). Программа отличается от многих своих конкурентов, т.к. при ее разработке были использованы специальные алгоритмы словарных замен, которые сказываются на правильности произношения читаемого текста. Так же в Demagog реализована бессловарная проверка орфографии.

Основные возможности программы:

чтение текстов из различных форматов: MS Word, E-Book и HTML (поддержка импорта рисунков);
возможность записи аудиофайлов в форматы: WAV, MP3, OGG, WMA, MP4;
возможность подключения пользовательских аудиокодеков;
подсветка орфографических ошибок;
поддержка словарей произношения (формат DIC), возможность их редактирования;
поддержка русского языка на 100%;
работает в OS Windows XP, Vista, 7, 8, 10 (32/64 bits).

Пример чтения книги

Ну и последнее, ICE Book Reader позволяет навести порядок на жестком диске с книгами: способа управлять информацией 250000 книг! Программа работает во всех популярных версиях Windows: XP, 7, 8, 10.

Главное окно программы // RussAcc

В настройках программы можно задать размер шрифта, указать цвет, которым выделять читаемый кусок. Можно указать и настроить параметры записи MP3: битрейт, кол-во бит и пр.

RussAcc поддерживает и работает со всеми популярными звуковыми движками. В своей же базе у программы для каждого слова есть особые его формы с ударениями в различных ситуациях (более 3 миллионов форм!).

Кстати, RussAcc поддерживает такой популярный формат электронных книг, как fb2 (а также может его конвертировать в обычный txt-файл). Поддерживает русский язык, совместимы с новыми ОС Windows 7, 8.1, 10.

Голосовые движки: мужские и женские

Вот поэтому, кстати, часто пользователи ругают ту или иную программу, что она не может прочитать русский текст (или вообще не может). Просто они забывают о необходимости установки речевого движка.

Голосовые движки могут быть выполнены в разных стандартах (так называемых), самые основные три: SAPI 4, SAPI 5 или Microsoft Speech Platform (примечание: почти в каждой программе для чтения, вы можете выбрать речевой движок).

Добротный стандарт, был актуален десяток лет назад. На сегодняшний день устарел, и на современных компьютерах/ноутбуках его использование не оправдано.

Почти все современные голосовые движки построены на этом стандарте (как платные, так и бесплатные). Наиболее популярный стандарт, можно найти движок с мужским, женским, детским голосами.

Microsoft Speech Platform

Microsoft Speech Platform – большой набор инструментов для разработчиков, которые позволяют реализовывать возможность преобразования текста в речь.

это набор инструментов, позволяющих разработчикам различных приложений, реализовывать в них возможность преобразования текста в голос.

Примечание! Чтобы синтезатор речи работал, необходимо:

Несколько голосовых движков

Тext-to-speech engines Дигало // Николай

Очень популярный русский голосовой движок (голос мужской!). Подойдет для большинства программ, которые умеют читать текст голосом. На мой скромный взгляд, один из лучших общедоступных движков для синтеза речи (на русском языке). Кроме русского, кстати, на сайте разработчика доступны движки еще для нескольких языков. Минус: без регистрации работает всего две недели.

Acapela // Голосовой движок (модуль) Алена

Голосовой движок (модуль) Катерина 2

Компания разработчик: ScanSoft RealSpeak

RHVoice

RHVoice — это многоязычный синтезатор речи с открытым исходным кодом. Можно использовать в ОС Windows и Linux. Синтезатор совместим с SAPI5. Разработчик синтезатора — Ольга Яковлева.

IVONA Tatyana/Maxim

Очень интересные молодые голосовые движки (их 2: мужской и женские голоса). Многие считают голос Татьяны одним из лучших (если не самым лучшим!). По ссылке выше, можно заслушать как будут звучать ваши тексты, так сказать, портфолио (на мой взгляд, очень приятно звучат).

Станет ли движок самым используемым — не знаю, время покажет!

Microsoft Speech Platform (Речевая платформа Microsoft) — это набор программных модулей и средств разработки, позволяющих разработчикам создавать приложения и сервисы с поддержкой речевых технологий (распознавание речи и синтез речи по тексту), а пользователям взаимодействовать с такими приложениями. В официальных анонсах можно встретить указание на то, что Речевая платформа является, в определённой степени, развитием речевых технологий Microsoft, известных под общим названием Microsoft Speech API (MS SAPI), однако это вполне самостоятельный программный продукт, который можно установить в системе независимо от того, присутствует ли в ней MS SAPI или нет.

Речевая платформа включает в себя компоненты времени выполнения Microsoft Speech Platform Runtime, которые необходимо установить всем желающим использовать платформу; средства разработки речевых приложений и служб Microsoft Speech Platform SDK, которые необходимы исключительно разработчикам программного обеспечения; а также языковые модули Language Runtime , устанавливаемые по выбору пользователя. Сейчас, в речевой платформе версии 11.0 поддерживаются 26 языков (в их числе и русский.

Требования к системе

На официальном сайте Microsoft предлагаются следующие минимальные и рекомендуемые требования к аппаратному и программному обеспечению систем, в которых предполагается использовать Microsoft Speech Platform Runtime 11 и Microsoft Speech Platform SDK 11.

Требования к программному обеспечению

Microsoft Speech Platform SDK 11 можно устанавливать на следующие операционные системы:

Операционная система	Редакция	Тип процессора
Windows Vista	Все, кроме Starter Edition	32-бит, 64-бит
Windows 7	Все, кроме Starter Edition	32-бит, 64-бит
Windows Server 2008	Service Pack 2	32-бит, 64-бит
Windows Server 2008	R2	64-бит

Внимание: Microsoft Speech Platform SDK 11 (за исключением Microsoft Grammar Development Tools) не поддерживается на Windows XP.

Разработка речевых приложений поддерживается на:

Windows Vista или более поздняя ерсии
Windows Server 2003 или более поздней версии
Windows Server 2008 или более поздней версии

Развёртывание речевых приложений поддерживается на:

Windows Server 2003 или более поздней версии
Windows Server 2008 или более поздней версии

Требования к аппаратному обеспечению

Минимальные аппаратные требования:

Процессор с тактовой частотой 1 ГГц
Оперативная память 512 Мб
Жёсткий диск 10 Гб
сетевой адаптер Ethernet
видеокарта, совместимая с DirectX9 с поддержкой 2.0 пиксельных шейдеров и вершинных шейдеров (используется для отрисовки изображений и средствах разработки пользовательского интерфейса)
USB 2.0

Рекомендуемая аппаратная конфигурация:

Процессор Dual 2 ГГц
Оперативная память 1 Гб
жесткий диск SATA 40 + Гб
сетевой адаптер Ethernet
Видеокарта, совместимая с DirectX9 с поддержкой 3.0 пиксельных шейдеров и вершинных шейдеров
Два хост-контроллера USB 2.0, которые необходимы при одновременном использовании эмуляции DVD и инструментов анализа производительности

Установка Microsoft Speech Platform SDK 11

Установка речевой платформы не представляет существенных трудностей. Ниже даются рекомендации и ссылки на страницы с компонентами, необходимыми для установки Microsoft Speech Platform 11.

Стало интересно, насколько хорошо Microsoft Speech умеет распознавать речь. В качестве источника для распознавания я решил взять аудиопоток переговоров полиции с сайта youarelistening.to.

Будем использовать System.Speech, т.к. в этом случае поддерживается диктовка, а в случае Microsoft.Speech — нет.

Еще нам потребуется библиотека для работы со звуком NAudio. Там есть пример Mp3StreamingDemo, который умеет работать с потоковым аудио. Он нам и нужен. Создаем свой проект. Из MP3StreamingPanel перетаскиваем к себе метод StreamMp3 и все что ему потребуется. Добавляем ссылку на NAudio.

В нашем классе создаем метод StartStreaming, который запустит StreamMp3 в отдельном потоке:

Конструктор нашего класса будет создавать и конфигурировать SpeechRecognitionEngine, В качестве грамматики будем использовать диктовку:

Данные из буфера копируем в MemoryStream, который передаем в SetInputToAudioStream. Тут необходимо правильно задать параметры формата аудио. Метод SetInputToWaveStream у меня не заработал.

Манипуляции с флагом completed и циклом с Thread.Sleep я взял из документации к Speech API. По какой-то причине без этого цикла распознавание не происходит.

Теперь осталось модифицировать заимствованный метод StreamMp3. Как только буфер почти заполнен, считываем из него данные:

И можно запускать:

Кончно же, на выходе получается полная околесица:

поэтому я пытаюсь встать и запустить MS Speech Platform 11 + SDK + Русский язык для TTS и SR

Кажется, что нет, потому что, когда я смотрю SpeechRecognitionEngine.InstalledRecognizers(), он возвращает 2 элемента:

Но я никогда не устанавливал эти распознаватели. Я просмотрел компонент Win 7 и не могу найти никакого отношения к этому.

Требуется ли устанавливать языки в x64 Program Files? Если да, то как это сделать?
Как настроить распознаватель и синтезатор для просмотра языков ru-RU?

Любая помощь очень ценится.

Использование Orca (инструкции по установке здесь) изменить MSSpeech_SR_ru-RU_TELE.msi и другие языки, которые вы хотели бы установить:

Перейдите к View → Summary Information и установите Platform: x64 .

Перейдите в таблицу Directory и измените все вхождения:

Установите выбранные языки.

Я использую Windows 7 64bit, и когда я впервые попытался установить эти Языки речи, они не были указаны в системе. Поэтому я искал решение.

Я нашел французский веб-сайт, объясняющий, что нам нужно изменить некоторые ключи реестра. Этот метод работает, но он очень длинный, и он оставляет много неиспользуемых ключей в вашем реестре.

Необходимые инструменты:

Шаги:

Выберите вкладку Таблицы.

Вы увидите список ключей реестра. Это должно выглядеть так:

Выбрать все строки (Ctrl + A)

Откройте свой любимый Текстовый редактор и Вставить внутри него.

В текстовом редакторе: Выбрать все (Ctrl + A) и Копировать ( Ctrl + C)

В этой статье я расскажу вам, как можно быстро и безболезненно установить на свой компьютер или ноутбук русский голосовой пакет, а проще говоря, установить на вашу операционную систему русскоязычный пакет файлов, чтобы ваш девайс мог разговаривать томным грудным голосом (ну или низким хриплым басом, кому как больше нравится:)).

Дело в том, что по умолчанию, после установки операционной системы на компьютер (ноутбук), у вас будет стоять только англоязычный пакет файлов. То есть некая мисс или миссис Анна может без труда прочитать вам какой-либо текст на английском языке, но вот русского языка она, увы, не знает.

Чтобы увеличить изображение, нажмите на картинку.

Как видно из рисунка, так оно и есть.

Для чего же нужно устанавливать на ноутбук русский голос? Собственно говоря, если вам только сейчас пришла в голову подобная мысль, то скорей всего, русский голос вам не нужен. По крайней мере, в настоящее время. Но в целом, это довольно полезная вещь. Например, вы хотите, чтобы перед сном вам почитали сказку (можно для взрослых ). Но самому читать лень или просто за целый день устали и болят глаза. В таком случае можно просто открыть необходимый текст в специальной программе (читалке) и дальше … просто наслаждаться чтением. Можно с закрытыми глазами. Голосовые файлы используют множество программ – читалки, говорилки, синтезаторы речи и т. п. программы.

Итак, где же скачать русский голос для Windows 7?

Допустим, мы установили на компьютер программу для чтения «Балаболка». Но вот не хочет она зараза читать совершенно русский текст, хоть ты тресни. Английский понимает, а с русским языком у неё проблемы.

Что делать в таком случае? Ответ прост – установить языковый голосовой пакет файлов для Виндоуз 7 (подойдут они, кстати, и для Windows XP, и для Виндоус Виста и т.д.).

Для работы синтезатора речи установим следующие компоненты от корпорации Майкрософт.

Среди множества различных языков выбираем русский. Русским голосом у нас говорит Елена. Вот эти два файла:

Total Size: 23.4 MB

После их загрузки запускаем и устанавливаем все три свежескачанных компонента системы. Перезагрузку системы можно и не делать.

Как проверить установился ли новый языковый пакет? Для этого открываем, например, программу «Балаболка». У меня есть версия Balabolka Portable 2.8.0.557.

Смотрим в ней Настройки – Голос, там должен появиться наш новый русский голос.

Как видно на скриншоте, у нас появился новый голос Microsoft Server Speech Text to Speech Voice (ru-RU, Elena).

Ну и традиционный анекдот напоследок.

В переполненное маршрутное такси залазят парень с девушкой. Парень отсчитал кучу мелочи и передал людям, чтобы те передали водителю. В это же время в маршрутке кто-то громко спустил воздух.

Водила в голос говорит: Ё-маё! Кто это так ДАЛ?!

Парень, который платил за проезд, кричит в ответ: Это я так ДАЛ, за себя и за девушку!

Всем удачи! Не забываем нажимать на кнопочки социальных сетей слева – вам нетрудно, а мне приятно;).

Читайте также: