Программы для расшифровки текстовых файлов

Обновлено: 06.07.2024

На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы. Основой содержимого стали интервью с её близкими и друзьями. С ними я встречался лично, записывал разговор на диктофон. Дальше начиналось самое интересное. Эти записи предстояло расшифровать в текст.

Пять лет назад подобный подарок я уже делал, подруге. В 2015-м ещё не имелось достойных сервисов, способных транскрибировать аудиофайлы в текст. Сейчас технологии достигли необходимого уровня.

Делюсь подборкой соответствующих сервисов, наиболее совершенных. Trial-версия в каждом из них даёт обработать от 30 минут до 9 часов. Как правило, этого достаточно для большинства непромышленных задач. Экспорт готовой стенограммы возможен в Word и т.п. Если звук чёткий, без посторонних шумов, а люди говорят внятно, то качество расшифровки будет близко к 100%. В полученном документе останется лишь настроить стили и разбить его на абзацы.

Здесь можно бесплатно расшифровать три файла. При этом максимальная длина каждого – до трёх часов. Итого, 1 аккаунт = 9 бесплатных часов. Если у вас больше трёх файлов, но все они суммарно меньше 9-часового лимита, просто «склейте» их предварительно в аудиоредакторе. Тогда вам будет достаточно одной учётки. В противном случае на каждые три файла придётся регистрировать новый профиль.

Примечание. Во время регистрации нужно привязать банковскую карту. Если не планируете покупать платный тариф, не забудьте после транскрибации удалить её данные в Настройках. Тогда через 7 дней деньги не спишутся. Безлимитный тариф стоит от 75$ в месяц.

На каждом из этих сайтов бесплатно можно обработать запись до 30 минут. Принцип работы, и, судя по всему, движок, один и тот же. Тарифы не совсем прозрачные. В т.ч., поэтому первый сервис удобнее.

UPD 3.02.2019
3. В комментариях ещё порекомендовали данный сервис от Google:

Cloud Speech-to-Text provides fast and accurate speech recognition, converting audio, either from…

При регистрации в любом из сервисов Google Cloud даётся 300$ на их использование (бесплатный trial). Этого хватит для перевода около 300 часов аудио в текст.

Используйте технологии XXI века для удобства и экономии времени!

Комментарий удален по просьбе пользователя

Cloud Speech-to-Text provides fast and accurate speech recognition, converting audio, either from…

60 минут через гугл и 9 часов через указанный в статье сервис. Разница очевидна.

60 минут в месяц бесплатно. 300 баксов дают при первой регистрации, тариф ($0.004 / 15 seconds), после 60 минут в месяц. И того 312.5 часов бесплатно, разница действительно очевидна. Я не эксперт, но что-то мне подсказывает, что все эти сервисы используют google,amazon,ibm и это в лучшем случаи и просто перепродают тебе. ред.

Да, действительно, вы правы. Гугл в таком случае выгоднее. Спасибо за информацию!

я правильно понял, что для того, чтобы им воспользоваться, нужно создать проект, сервисный аккаунт, учетные данные (и т. д.?)?

регистрация и добавить карту ввести данные, проверять их не будут в том плане, что высылать скан паспорта не надо , а дальше да проект получить ключ и дальше и тд. Сейчас дают 300 баксов на 3 месяца, а не на год уже.

Ага, и еще, как выяснилось, нужна программа на питоне. Я не программист, нашел такую инструкцию, сделал всё по ней, но застопорился в этом месте, такую ошибку получаю:

NameError Traceback (most recent call last)
in ()
61 storage_client = storage.Client(project_id)
62 blobs = storage_client.list_blobs(bucket_name)
—-> 63 for blob in blobs:
64 print(blob.name)
65 list_blobs(bucket_name)

NameError: name 'blobs' is not defined

When it comes to conducting user research and interviews, having a written transcript of the words…

"На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы"
Это же какое ЧСВ должно быть у тебя и у твоей мамы что бы такие подарки вообще дарить

Лучший подарок для мамы - это ЖУРНАЛ, сделанный своими руками, но С ПОМОЩЬЮ бесплатной программы по переводу аудио в текст!
Капец, на дворе 21 век, а тут такое, ёперный театр!

Так, ладно, шутки шутками, но скоро 8 марта, пойду доделывать газету для мамы :))))) ред.

Классная ирония про газету)) В интернете, кстати, полно услуг по созданию именных журналов в подарок. Я делал всё сам, в т.ч. вёрстку, процесс от А до Я занял 3 недели. Если нет времени, можно отдать от 10 тыс. и выше, за вас всё сделают спец. фирмы)

Уважаемый Андрей, попробуйте сделать данный подарок своей маме, жене или сестре. Именинница оценит. Вам вовсе не обязательно заказывать тираж 5 тыс. экземпляров, чтобы распространять его через магазины посторонним лицам. Достаточно одного. Таким образом ваше ЧСВ и ЧСВ вашего близкого останется на адекватном умеренном уровне.

Я бы не оценила. Но у нас с вами разные представления о жизни и нашем месте в этом мире и жизни окружающих.

Через гугл переводчик вы можете только наговорить текст. Загрузить аудиофайл для транскрибации невозможно. ред.

Комментарий удален по просьбе пользователя ред.

Можно так завести и в системную диктовку, которая будет работать прямо в Ворде и оффлайн, если это важно (на маке точно, на Win10 вроде тоже есть подобное)

Согласна но там ограничение по символам, беда, Роман

Осталось только теперь БЕСПЛАТНО раздобыть программу по переводу 4К видео в диафильмы и привет 19 век!

Спасибо!
Не понимаю, почему с этим так тухло
Вот пара сервисов есть и хорошо
А софта оффлайн нормального нет

При том что сама технология в любом свежем андроиде есть

беда лишь в том, что андроид ненужон

Пользовался таким способом расшифровать текст: заходил в гугл переводчик, запускал распознавание текста по голосу и включал на фоне, собственно, сам файл. Там в настройках микшера немного надо повозиться, чтобы все работало, но это один из самых действенных и бесплатных способов расшифровать текст.

Кстати. Для Клауд Спич Гугл сначала нужно скачать файл, а уже после загрузить его для обработки. Если файл весит много, а интернет не самый быстрый, то скачивание, а потом заливка в Клауд Спич Гугл - слишком долго. Да и в целом довольно нерационально сначала скачивать видео из интернета, а потом его обратно туда загружать.

В Тринт можно загрузить файл по прямой ссылке. Если надо расшифровать видео с известного хостинга, например, ютуба, я делаю так:
1. Копирую url нужного видео
2. Иду на savefrom, чтобы "выдернуть" прямую ссылку на видео
3. Иду на Тринт, там выбираю функцию "добавить через url"

Готово. Существенная экономия времени.

Подскажите пожалуйста, удалось удалить карту? у меня такая же проблема

Если раньше криптография была уделом спецслужб и научно-исследовательских институтов, то сегодня воспользоваться преимуществами продвинутых алгоритмов шифрования для защиты конфиденциальных данных может любой желающий. В этом материале мы рассмотрим 5 лучших бесплатных приложений, с помощью которых вы сможете без особого труда зашифровать необходимые файлы и папки на жестком диске вашего компьютера.

Лучшие программы для шифрования данных

И начнем мы с популярного архиватора для Windows, имеющего ряд неофициальных реализаций для Mac OS и Linux. Удивляться не стоит, ведь 7zip поддерживает шифрование файлов и папок с помощью одного из самых стойких криптографических алгоритмов AES с 256-битным ключом, который, в частности, рекомендован Агентством национальной безопасности США для защиты документов, составляющих государственную тайну. Чтобы выполнить шифрование, достаточно указать пароль в соответствующем поле, после чего программа создаст архив, получить доступ к которому сможет лишь тот, кому известна кодовая фраза.

Также рекомендуем проставить галочки в чекбоксы «Удалять файлы после сжатия» и «Шифровать имена файлов» (без этой опции просмотреть содержимое архива сможет любой желающий).

К несомненным преимуществам 7zip можно отнести высокую производительность, возможность задать индивидуальный пароль для каждого зашифрованного архива и простоту использования. Главным же его недостатком является отсутствие какой-либо автоматизации: вам придется вводить пароль каждый раз, когда вы захотите получить доступ к защищенному контейнеру, изменить один из файлов или добавить новый. Таким образом, 7zip можно назвать «казуальным» приложением для шифрования, которое подойдет тем, кому подобный функционал необходим лишь время от времени.

Encrypto

Если вы не пользуетесь 7zip, но нуждаетесь в таком же простом и легковесном инструменте, рекомендуем обратить внимание на приложение Encrypto , разработанное компанией MacPaw для операционных систем Windows и MacOS. После его установки в контекстном меню операционной системы появится опция Encrypt with Encrypto, с помощью которой вы сможете шифровать отдельные файлы и папки. Подобно архиватору, утилита использует высоконадежный алгоритм AES-256, а сами ключи генерируются на основе заданного пароля.

Интересной особенностью Encrypto является возможность добавления к защищенному контейнеру подсказки, которая поможет вспомнить пароль или сообщить кодовую фразу другу с помощью понятных только вам двоим ассоциаций.

Благодаря этому вы можете использовать Encrypto для передачи зашифрованных файлов по открытым каналам (e-mail, мессенджеры, cloud-сервисы), не опасаясь, что ценная информация будет перехвачена.

GnuPG

Впрочем, существует и куда более надежное решение для обмена зашифрованными данными в Интернете, и это — GnuPG , использующая асимметричные пары ключей. Приложение доступно практически на всех операционных системах, включая Windows, Mac OS, Linux и FreeBSD. Реализация программы для Windows получила название GPG4Win и включает в себя, помимо собственно GnuPG, удобную визуальную оболочку Kleopatra для управления ключами шифрования, менеджер сертификатов, плагин для почтового клиента Outlook и плагин для проводника операционной системы.

Даже если открытый ключ попадет в руки злоумышленников, для них он будет абсолютно бесполезен, ведь все, что они смогут сделать, — это зашифровать новые файлы, тогда как расшифровать существующие у них не получится. По этой причине GnuPG де-факто является золотым стандартом защиты электронной переписки, благо приложение можно с легкостью интегрировать в любой популярный почтовый клиент с помощью соответствующего плагина.

Cryptomator

В отличие от всех перечисленных выше приложений, Cryptomator использует так называемое прозрачное шифрование. После первого запуска программа предложит вам создать защищенное хранилище, которое с точки зрения операционной системы является одновременно и директорией, и динамически расширяемым (его объем изменяется автоматически и зависит от количества свободного места, доступного в текущем логическом разделе) виртуальным диском. Данный факт обеспечивает два чрезвычайно важных преимущества:

  1. зашифрованный контейнер можно разместить внутри сетевой папки OneDrive, «Яндекс.Диск», Google Drive, DropBox или любого другого облачного сервиса и синхронизировать данные между разными устройствами;
  2. вы можете работать с защищенным разделом точно так же, как с обычным диском, создавая, редактируя и удаляя файлы и папки без необходимости каждый раз повторно вводить пароль — это потребуется сделать лишь один раз, при его разблокировке.

Cryptomator существует в нескольких версиях, в том числе и для мобильных устройств, работающих под управлением iOS и Android. Еще одной интересной особенностью приложения является ведение подробной статистики обращений к каждому защищенному хранилищу, позволяющей оценить расход трафика.

С учетом возможностей, простоты настройки и использования, Cryptomator способен стать отличным подспорьем для организации удаленного взаимодействия между сотрудниками небольшой компании, обеспечив необходимый уровень безопасности корпоративных данных.

VeraCrypt

На фоне собратьев VeraCrypt выглядит настоящей «тяжелой артиллерией». Программа предлагает своим пользователям огромное количество продвинутых функций для шифрования файлов, папок и даже целых разделов жесткого диска. Перечислим основные возможности приложения:

  • Создание зашифрованного контейнера внутри файла

VeraCrypt позволяет создать виртуальный зашифрованный раздел внутри файла любого типа, причем со стороны такой контейнер будет выглядеть как обычный текстовый документ, видеоролик или музыкальный трек.

С помощью VeraCrypt можно зашифровать любой несистемный том на жестком диске, внешнем винчестере или флеш-накопителе. Также приложение позволяет создать внутри защищенного хранилища скрытый раздел, использующий собственные ключи шифрования, и, таким образом, обеспечить дополнительную защиту критически важных данных.

VeraCrypt предлагает уникальную в своем роде функцию — возможность шифрования раздела с установленной операционной системой. Также приложение позволяет создать скрытый системный раздел с независимой копией ОС, что поможет дополнительно защитить компьютер.

Программа поддерживает сразу несколько алгоритмов шифрования: AES, Serpent, Twofish, Camelia и Kuznyechik, позволяя комбинировать перечисленные методы между собой (доступно 10 возможных комбинаций на выбор).

Помимо паролей, для ограничения доступа к защищенным контейнерам можно использовать один или несколько ключей, в роли которых могут выступать файлы любого типа (картинки, аудио- или видеозаписи, текстовые документы, архивы и т. д.), директории с их содержимым, а также токены безопасности.

Как видите, VeraCrypt предлагает исчерпывающий набор инструментов для защиты конфиденциальных данных. И, проявив достаточную смекалку, с помощью этой программы можно создать действительно надежное зашифрованное хранилище, скрытое от посторонних глаз.

Аппаратное шифрование для защиты персональных данных

При всех многочисленных достоинствах перечисленные приложения имеют и один, но весьма серьезный недостаток: каждое из них использует в своей работе сугубо программное шифрование. И вот почему это плохо:

  • криптографические ключи создаются на основе неких входных данных (кодовой фразы, координат курсора мыши и т. д.), имеющих сравнительно низкий уровень энтропии (хаотичности), что упрощает процесс взлома;
  • данные, необходимые для дешифровки, хранятся в скрытых папках операционной системы, реестре или даже в самом зашифрованном контейнере (как в случае с 7zip или Encrypto) и могут быть сравнительно легко обнаружены и скопированы удаленно или с помощью троянских программ;
  • во время шифрования все необходимые алгоритмы и ключи выгружаются в оперативную память компьютера, откуда могут быть извлечены посредством вредоносного ПО, с помощью метода «холодной перезагрузки» и других аналогичных манипуляций;
  • поскольку шифрование и дешифровка осуществляются центральным процессором ПК или ноутбука, на котором установлено криптографическое приложение, это упрощает проведение атак по сторонним каналам, основанных на анализе времени выполнения вычислений, колебаниях уровня потребления энергии и т. д.

Подобных недостатков лишены внешние накопители со встроенными криптографическими модулями — например, настольные жесткие диски My Book емкостью от 4 до 18 терабайт и ультракомпактные портативные My Passport объемом от 1 до 5 ТБ от Western Digital.

Стильный дизайн, совместимость с компьютерами под управлением Microsoft Windows 8.1 и 10 или Apple macOS версии 10.13 и выше, наличие высокоскоростного порта USB 3.2 Gen 1 с пропускной способностью 640 МБ/с — преимущества этих устройств можно перечислять бесконечно. Однако главной их фишкой является поддержка полноценного аппаратного шифрования на базе упомянутого нами ранее алгоритма AES-256.

В комплекте с каждым экземпляром My Book и My Passport поставляется бесплатный программный пакет WD Discovery, включающий в себя ряд сервисных утилит:

Позволяет получить исчерпывающие сведения о текущем состоянии накопителя на основе показателей S.M.A.R.T., проверить жесткий диск на наличие битых секторов или, при необходимости, уничтожить сохраненные на HDD данные (при этом файлы будут несколько раз перезаписаны, чтобы их нельзя было восстановить).

С помощью этой программы вы можете настроить резервное копирование по расписанию, выгрузку бэкапов в облако (поддерживаются Google Drive и Dropbox) или, напротив, загрузку файлов из cloud-сервиса на диск или локальный компьютер. Кроме того, приложение позволяет подключиться к вашему профилю на Facebook и скачать сохраненные фото и видео прямо на внешний жесткий диск.

Эта утилита позволяет управлять шифрованием данных на внешнем жестком диске. Разберемся, как это работает.

Портативный накопитель WD My Passport и работа с WD Discovery Портативный накопитель WD My Passport и работа с WD Discovery

На первый взгляд, использование WD Security мало отличается от того же Encrypto: все, что требуется от владельца внешнего жесткого диска, — указать надежный пароль и активировать защиту, после чего вся информация на HDD будет зашифрована. В дальнейшем, чтобы использовать накопитель, его сперва нужно будет разблокировать с помощью кодовой фразы. Также можно создать список доверенных устройств, при подключении к которым внешний жесткий диск будет разблокироваться автоматически.

Однако надо понимать, что сама по себе WD Security не занимается шифрованием, а лишь предоставляет удобный визуальный интерфейс для управления встроенным в винчестер криптографическим модулем. Наличие аппаратного блока шифрования обеспечивает ряд важных преимуществ:

  • за создание ключей шифрования отвечает аппаратный генератор случайных чисел, что помогает добиться высокой степени энтропии и повысить их устойчивость к взлому;
  • криптографические ключи хранятся в энергонезависимой памяти шифратора и не выгружаются в оперативную память компьютера даже во время работы с файлами, что помогает свести к минимуму вероятность их перехвата;
  • поскольку весь процесс шифрования осуществляется собственным криптографическим модулем жесткого диска, это существенно осложняет проведение атак по сторонним каналам;
  • благодаря наличию независимого чипа, отвечающего за шифрование данных, скорость обработки файлов никак не зависит от производительности клиентского устройства.

Все вышеперечисленное позволяет практически полностью исключить вероятность хищения конфиденциальной информации и гарантировать безопасность сохраненных данных.

Транскрибация (расшифровка) аудио/видео в текст — не слишком творческая, но порой обязательная часть работы. Например, когда вы готовите интервью, материал по выступлению спикера или извлекаете тезисы из того, что наговорили на диктофон во время прогулки.

И это скучное занятие превратится в настоящее мучение, если работать по подобной схеме:

  • Открываем аудиофайл в проигрывателе Windows.
  • Создаем новый документ в Notepad/Word.
  • Запускаем воспроизведение и переключаемся в текстовый редактор.
  • Пишем, пока успеваем и хорошо слышим.
  • Если запнулись или не расслышали, переключаемся на проигрыватель.
  • Останавливаем воспроизведение и перематываем.
  • Включаем, переключаемся на текстовый редактор и т. д.

Рассказываем, как можно ускорить и упростить перевод аудио/видео в текст.

1. Автоматизировать транскрибацию

Конечно, в эпоху нейросетей не обошлось без решений для автоматического перевода звука в текст.

Google Docs

В Гугл Документах есть встроенный инструмент для расшифровки аудио с микрофона (файлы не транскрибирует). Можно вызвать его через Ctrl+Shift+S, далее выбрать язык и нажать на значок микрофона.

Очень плохо справляется с тихой и шумной диктофонной записью, достаточно хорошо — с диктовкой в микрофон.

Главный недостаток — работает только в активном окне Google Docs, то есть наговорить что-то с другой вкладки (или включить запись на компьютере) не получится.

Чтобы добавить в текст пунктуацию, нужно надиктовывать знаки голосом: точка, запятая, вопросительный/восклицательный знак, новая строка, новый абзац, кавычки. Это работает в большинстве приложений для диктовки (иногда для этого нужно найти нужную галку в настройках).

Пример работы голосового ввода Google Docs

Пример работы голосового ввода Google Docs

Speechpad

Расшифровывает только звук с микрофона, поэтому тот должен быть хорошего качества. Поддерживается Google Chrome, но есть еще приложения для iOS и Android. Плюс возможна интеграция с Windows, Mac и Linux — чтобы обеспечить голосовой ввод в любом текстовом поле. Хороший звук понимает достаточно хорошо, плохой — очень плохо.

Фрагмент YouTube-ролика хорошо перевел в текст, в общем и целом, редактуры не очень много

Фрагмент YouTube-ролика хорошо перевел в текст, в общем и целом, редактуры не очень много

RealSpeaker

Платный онлайн-расшифровщик. Работает только с готовыми файлами, что-то наговорить с микрофона здесь нельзя. Переводит аудио в текст бесплатно, но только если запись длится до 1,5 мин. Далее стоимость — 8 руб. за минуту, максимальная продолжительность аудио — 180 мин. Поддерживается почти 40 языков, включая русский и украинский.

Интересно, что в разделе «Мои медиа» доступны транскрибированные тексты других пользователей. Можно приблизительно оценить качество расшифровки, подумать, стоит ли платить за нее деньги. Это же удобство — пугает. Никакой приватности, можно даже редактировать и удалять чужие тексты.

Оплаченный текст будет доступен только вам. Интересно, что при загрузке видео результат можно скачать сразу в формате субтитров (*.srt).

Сервис сейчас в бета-версии, многие функции вызывают вопросы. Например, нельзя удалить загруженный файл из облака, но со временем файлы удаляются автоматически.

Пример транскрипта другого пользователя, текст доступен абсолютно всем

Пример транскрипта другого пользователя, текст доступен абсолютно всем

Dictation

Тоже онлайн-сервис для распознавания речи. Бесплатный. Работает только со звуком с микрофона, готовые записи загрузить нельзя. Понимает не только русские слова, но и десятки команд («тире», «новая строка» и др.).

Четкую речь блогера, подготовленную профессионально и в тишине, распознал почти идеально. Речь героя интервью из того же YouTube-ролика, которая была записана без петлички и с фоновым шумом, уже понял только наполовину. С диктофонной записью все печально.

Пример того, как работает Dictation (1 — качественная запись, 2 — посредственная)

Пример того, как работает Dictation (1 — качественная запись, 2 — посредственная)

Это платная десктопная Windows-программа для расшифровки речи, не требующая доступ к интернету. Работает как с микрофоном, так и с готовыми аудиозаписями — поддерживаются все популярные форматы (wav, mp3, wma). Правда, последнее возможно только на дорогих тарифах.

Важный момент — программа обучается на ваших документах, начинает лучше понимать лексику и стиль, расширяет базовый словарный запас. Алгоритм версии 2.0 дообучен на звуковых данных, записанных на расстоянии 1 м от микрофона — для улучшенного распознавания со встроенных устройств и диктофонов.

Базовый тариф стоит 1867 руб. в год, профессиональный — 15 500 руб. (дальше продлевать будет дешевле в разы). Разница между ними — в функциональности (например, транскрибация аудиозаписей и встраивание в Word есть только у Voco.Professional). Необязательно платить сразу — есть триал на 2 недели.

Так Voco расшифровал озвученную статью Дурова о Долине. Не особо впечатляет, хотя это результат сразу после установки программы, без обучения

Так Voco расшифровал озвученную статью Дурова о Долине. Не особо впечатляет, хотя это результат сразу после установки программы, без обучения

Экзотика: субтитры YouTube

Наверняка вы замечали, что YouTube достаточно хорошо автоматически расшифровывает, что говорят герои в видеороликах. Можно использовать эту технологию и в личных целях. Метод экстремальный, но вполне доступный при отсутствии других возможностей для расшифровки.

Загружаете с ограниченным доступом любое видео, открываете его в «Творческой студии», переходите в раздел «Субтитры». Далее выбираете язык, подтверждаете и — готово. Субтитры можно скачать в формате .sbv, файл легко откроется в стандартном Блокноте.

Проблема в том, что выгружаются именно субтитры — с таймкодами и постоянным разрывом текста. Довольно сложно собрать нормальный материал, если видео длинное. И еще сложнее, если качество звука оставляет желать лучшего. А если у вас не видеозапись, а чистое аудио — придется еще и превращать его в видео в каком-нибудь редакторе для такого способа расшифровки.

Используя автозамены и макросы в редакторе, такой текст несложно вычистить от таймкодов. А вот собирать в связные абзацы придется вручную.

Так выглядит файл с субтитрами, который скачивается из «Творческой студии» YouTube

Так выглядит файл с субтитрами, который скачивается из «Творческой студии» YouTube

2. Усовершенствовать ручную расшифровку

Можно пойти другим путем — не автоматизировать, но упростить работу и транскрибировать без кошмара, описанного в самом начале статьи. Вам все равно придется слушать и записывать, но это будет удобно делать внутри хорошо обустроенного сервиса.

oTranscribe

Бесплатный веб-сервис для ручной транскрибации текста. Работает как с аудио, так и с видео, в том числе YouTube-роликами. Открывает десятки форматов: wav, mp3, mpeg, webm и др.

Можно назначить горячие клавиши для управления воспроизведением. Есть автосохранение, простой текстовый редактор, интерактивные метки, упрощающие навигацию.

Интерфейс oTranscribe

Интерфейс oTranscribeИнтерфейс oTranscribe

Express Scribe

Условно-бесплатное десктопное ПО для Windows/Mac. Позволяет загружать аудио и видеофайлы с самых разных источников: дисков, FTP-серверов, электронных писем и др. Поддержка форматов зависит от версии: например, mp3 и wav открываются в любом случае, а wmv, mp4 или 3gp — только в Pro.

Гибкие настройки воспроизведения: управляйте горячими клавишами, меняйте скорость, переключайтесь на определенный таймкод. Можно добавлять заметки к файлам, подключать к работе ножную педаль — специальное устройство, USB-переключатель для геймеров и транскрибаторов.

Удобно, что все записи добавляются в список и между ними легко переключаться — не нужно каждый раз заново их загружать. Неудобно, что нет текстового редактора (зато есть интеграция с MS Word, Corel Wordperfect, Lotus Wordpro ​​и другими текстовыми процессорами под Windows).

Неограниченная лицензия PRO стоит от 25 $, но для личного использования вполне хватит бесплатной версии.

Transcriber Pro

Тоже десктопный инструмент для ускорения ручной расшифровки (правда, только аудио в текст и только для Windows). Функциональность похожа на аналогичные решения: есть управление горячими клавишами, создание заметок (тегов), автозамена текста, настройка «прыжка» после паузы и др.

В числе преимуществ Transcriber Pro также указали командную работу — возможность разбивать проект на подзадачи, выгружать их и пересылать, потом объединять результаты в один файл. Участники команды будут работать в офлайне, но результат потом соберется в одно целое.

Платная лицензия стоит 640 руб. в год, но ее нет смысла покупать ради такой функции, как экспорт в интерактивные стенограммы. Этот формат похож на обычные субтитры, которые, например, выгружаются с YouTube.

LossPlay

Это десктопный плеер для Windows в помощь расшифровщикам аудио/видео. Открывает mp3, wav, mp4 и др. (разработчики отмечают, что есть также «интеллектуальная поддержка недокументированных форматов», что бы это ни значило). Парит поверх всех окон, поэтому позволяет работать в любом текстовом редакторе.

Hot keys настраиваются не только для управления воспроизведением, но и для вставки шаблонных текстовых фрагментов. Если не нравится стандартный дизайн, в настройках можно задать элементам другие цвета.

Придется по душе тем, кто ностальгирует или до сих пор пользуется Winamp.

Такой вот внешний вид у LossPlay

Такой вот внешний вид у LossPlay

Бесплатно можно получить только 1 минуту автоматической расшифровки. Далее — 6$ в час. Ручная транскрибация тоже стоит денег, но совсем небольших — 20$ в год.

Так выглядит инструмент для ручной транскрибации

Так выглядит инструмент для ручной транскрибации

Пример работы авторасшифровщика

Пример работы авторасшифровщика

3. Просто делегировать эту работу

Наконец, необязательно заниматься транскрибацией самому, неважно, автоматически или вручную. Можно делегировать это сторонним исполнителям. Например:

  • Zapisano — служба расшифровки аудиозаписей, которая готова «освободить творческих людей от рутинной работы».
  • YouDo — проект для поиска заказчиков и исполнителей.
  • FL — крупнейшая русскоязычная фриланс-биржа.
  • Kwork — онлайн-магазин фриланс-услуг.
  • Advego — биржа контента.

Из всего списка только Zapisano специализируется именно на расшифровке (и это хороший повод выбрать именно их). Работают в сервисе живые стенографисты — они предлагают тексты без слов-паразитов и оговорок, в удобном формате. У заказчика есть личный кабинет, куда загружаются записи, где видны статусы и можно скачать результат. Оплатить можно банковскими картами, электронными деньгами или по безналичному расчету.

Стандартный тариф — около 30 руб. за минуту. Придется платить больше при пониженном качестве записи, наличии специальной терминологии или повышенной срочности.

Начало работы с Zapisano

Начало работы с Zapisano

Коротко о главном

— Высококачественное аудио можно попробовать расшифровать автоматически — тогда потребуется минимум правок. Чем хуже качество, чем больше шумов, чем тише голос — тем дольше нужно будет возиться с текстом после автотранскрибации. Примеры инструментов: Google Docs, RealSpeaker, Dictation, Voco.

— Можно просто делегировать это дело фрилансерам — они сами разберутся, какой способ расшифровки аудио им выбрать и использовать. Как правило, стоимость часа работы опытного автора/редактора/журналиста в разы выше, чем цена на транскрибацию текста. Выгоднее заплатить сторонним исполнителям, а не тратить часы на рутину. Специалистов можно найти на Zapisano, YouDo, FL, Kwork и других площадках.


Зачем может понадобиться конвертировать аудио в текст

Для помощи в расшифровке аудио в текст есть сервисы. Мы составили список из программ и ботов в социальных сетях, их существует больше, но мы выбрали самые удачные. Некоторые работают с русскими, некоторые с иностранными текстами. Всеми сервисами из подборки можно пользоваться бесплатно, но в некоторых нужно будет зарегистрироваться.

Сервисы для перевода речи в текст

Блокнот для речевого ввода

Возможности: перевод диктуемых слов в текст, транскрибирование речи из аудио и видео с Ютуба.

Сервис автоматически расшифровывает произносимые слова по ходу надиктовки, причем умеет распознавать знаки препинания, если отметить пункт «Заменять слова пунктуации». Мы надиктовали ему «Привет восклицательный знак мы тестируем запятая как справляется сервис с расшифровкой текста точка» и так далее, самые часто употребляемые знаки он распознал, но не справился с многоточием, тире, скобками и кавычками.

Сервис для расшифровки аудио в текст

Тест сервиса на знаки препинания

Расшифровка аудиодорожки в текст

Транскрибирование текстов из загруженных аудиозаписей и из видео с Ютуба происходит в реальном времени при воспроизведении. Загружаем файл в сервис или указываем ID видео (символы после Сервис транскрибирует речь ведущего

Бесплатно сервис работает с транскрибированием онлайн без ограничений, а также с распознаванием голоса на аудио и видео не дольше 15 минут.

Сервис не идеальный, но работает бесплатно, прост в управлении и не требует регистрации. Результат расшифровки может быть довольно чистым — всё зависит от дикции и скорости речи. Лишний повод потренироваться, если диктуете для себя, но нужно привыкнуть называть знаки препинания, если не хочется расставлять их потом.

Инструмент полезен, когда нужно надиктовать себе материал для текста или в заметку, расшифровать подкаст или интервью. Его можно включить фоном в процессе интервью, чтобы сервис расшифровывал речь в реальном времени.

Расширение «Голосовой ввод текста» для Google Chrome

Возможности: диктовка текста в соцсетях, строке поиска и на сайтах. Диктовка в приложениях Windows,Linux и Mac.

От сервиса «Голосовой блокнот» есть браузерное расширение для переписки в соцсетях и речевого ввода текста на сайтах, а еще дополнительный модуль для использования в приложениях Windows.

Расширение для соцсетей и форумов

Расширение для перевода речи в текст

Выбор расширения по клику правой кнопкой

Сложно привыкнуть диктовать знаки препинания, на их озвучивание уходит много времени, но зато не нужно расставлять запятые вручную.

Результат расшифровки зависит от дикции говорящего, но в целом расширение для ввода хорошо справляется.

Расшифровка в любых приложениях Windows, Linux и Mac

Дополнительный бесплатный модуль для интеграции открывает тестовый период режима, который позволяет вводить текст напрямую в любые браузеры и приложения Windows: Word, Excel, Google Docs и другие — в любые места, где используется клавиатура. Для этого нужно зарегистрироваться в Голосовом блокноте и установить модуль.

Как установить модуль интеграции Голосового блокнота:

После установки модуля нужно зайти в личный кабинет и включить тестовый период:

Как работать в блокноте для речевого ввода

Личный кабинет в сервисе

Если все прошло успешно, в блокноте у пункта Интеграция с OS появится срок действия тестового периода.

Как работать в сервисе Голосовой блокнот

Даты тестового периода

Попробуем надиктовать текст, например, в Word:

Текст получилось надиктовать в Google Docs, Блокнот и почту Gmail:


Диктовка письма в Gmail

Чистота расшифровки зависит от дикции, громкости и скорости речи, после диктовки скорее всего придется внести несколько правок в окончаниях и заглавных буквах.

Тестовый период длится всего три дня, его хватит, чтобы понять, нужен ли вам сервис. Плата небольшая: 100 рублей за месяц, 250 за три или 800 за год использования расширенных возможностей.

Dictation.io

Возможности: расшифровка живой речи, подкастов и озвучки видео в текст в реальном времени.

Сервис Dictation заявлен как мультиязычный, он может распознавать речь на более 100 языках. Он использует движок распознавания речи Google.

С живой диктовкой он справился довольно хорошо, распознал голосовое обозначение знаков препинания «точка», «запятая».


Расшифровка диктовки специально для сервиса

Расшифровка подкаста «Это реальная история — Дело об исчезновении Кристофа Сиона» получилась не очень чистой, хотя ведущая говорила внятно. Видимо, дело в скорости речи.

Как расшифровать подкаст автоматически

Расшифровка подкаста

С транскрибированием ролика «Regional German Dialects» на канале Easy German сервис справился отлично. Ведущая с хорошей дикцией говорила в обычном не быстром темпе.

Транскрибация видео онлайн

Расшифровка речи из видео

Dragon Dictation

Возможности: расшифровка надиктованных предложений в текст.

Программа для iOS, работает онлайн через iTunes Store. Удобно использовать на мобильном, чтобы надиктовывать на ходу замечания или идеи к новым статьям.

Сервис для расшифровки голоса в текст

Расшифровка речи

Программа работает бесплатно, но только на iOS.

Otter

Возможности: распознавание англоязычной речи в записи или на диктовке с возможностью идентифицировать собеседников.

Сервис для распознавания речи и расшифровки аудио или видео. Работает только с английским языком. Если не пропустить первые шаги настройки и прочитать сервису текст на экране, он запомнит ваш голос. Это позволит ему отделять ваши реплики от чужих в записях с несколькими собеседниками.

Англоязычный сервис для расшифровки голоса

Сервис транскрибировал фразу на английском

Фразу «расшифруй что-нибудь на русском» он распознал так:

Распознавание голоса ботом

Фразы на других языках сервис не понимает

Можно загрузить аудио или видео с английской речью, сервис выведет текст. Некоторые спорные моменты из-за произношения могут расшифровываться неправильно.

Транскрибация фразы на английском

Сервис не распознал слово penguins

Программа бесплатна, она будет полезна, если вы работаете с англоязычными источниками.

Бот в ВКонтакте

Как добавить бота для расшифровки голосовых

Приглашаем бота в беседу

Дальше выбираем нужный чат, куда добавим бота в качестве участника.

В настройках чата находим среди участников бота и даем ему доступ к переписке.

Бот в Телеграме

Бота нужно настроить. Команда /language вызывает выбор языка, на котором будут записываться голосовые, /engine дает выбрать движок:

Команда /silent отключит уведомления о том, что бот приступил к работе над войсом.

Для отключения бота в чате нужно набрать команду /files.

Иногда нужна точная расшифровка аудиозаписи, но на внесение правок в распознанные тексты или самостоятельный набор с нуля нет времени. В этом случае пока единственный выход — делегировать ручную расшифровку кому-то другому.

За помощью можно обратиться к фрилансерам или в специализирующиеся на транскрибации фирмы. Однако в первом случае придется потратить дополнительное время на поиск ответственного исполнителя и согласование условий, а во втором — на общение с менеджерами по почте.

Интерфейс простой и понятный. После регистрации загрузите файлы или скопируйте ссылку на запись:

Загрузка аудиозаписей

Загрузка аудиозаписей для расшифровки

Сервис автоматически подсчитает длительность и спросит, какой тип расшифровки нужен — стандартный, для суда или перевод с иностранного языка. Вам нужно будет только выбрать тариф в зависимости от срочности работы:

Выбор тарифа

Выбор формата тарифа для расшифровки

Прогресс по задачам удобно отслеживать в личном кабинете. Там вы увидите подробности по каждой:

Личный кабинет

Личный кабинет с прогрессом по задачам

Интерфейс также оптимизирован под мобильные устройства, поэтому в кабинет удобно загружать записи, сделанные на телефон.

Тестовый перевод можно сделать бесплатно, так что у вас будет возможность оценить сервис.

Читайте также: