Распознавание речи в видео

Для того, чтобы распознать речь и перевести её из аудио или видео в текст, существуют программы и расширения (плагины) для браузеров. Однако зачем всё это, если есть онлайн сервисы? Программы надо устанавливать на компьютер, более того, большинство программ распознавания речи далеко не бесплатны.

Основной функционал сервиса:

  • поддержка 30 языков, среди которых присутствуют даже венгерский, турецкий, арабский, китайский, малайский и пр.
  • автораспознавание произношения знаков препинания, перевода строки и пр.
  • возможность интеграции со страницами любого сайта
  • наличие плагина для Google Chrome (называется «VoiceRecognition»)

В деле распознавания речи самое важное значение имеет именно качество перевода речи в текст. Приятные «плюшки» и вохможности – не более чем хороший плюс. Так чем же могут похвастаться в этом плане оба сервиса?

Сравнительный тест сервисов

Для теста выберем два непростых для распознавания фрагмента, которые содержат нечасто употребляемые в нынешней речи слова и речевые обороты. Для начала читаем фрагмент поэмы «Крестьянские дети» Н. Некрасова.

Ниже представлен результат перевода речи в текст каждым сервисом (ошибки обозначены красным цветом):

Как видим, оба сервиса практически с одинаковыми ошибками справились с распознаванием речи. Результат весьма неплохой!

Теперь для теста возьмем отрывок из письма красноармейца Сухова (к/ф «Белое солнце пустыни»):

Как видим, оба сервиса весьма достойно справляются с распознаванием речи – выбирайте любой! Похоже что они даже используют один и тот же движок — уж слижком схожие у них оказались допущенные ошибки по результатам тестов ). Но если Вам необходимы дополнительные функции типа подгрузки аудио / видео файла и перевода его в текст (транскрибация) или синхронного перевода озвученного текста на другой язык, то Speechpad будет лучшим выбором!

Ну а это краткая видео инструкция по работе со Speechpad, записанная самим автором проекта:

Друзья, понравился ли Вам данный сервис? Знаете ли Вы более качественные аналоги? Делитесь своими впечатлениями в комментариях.

Сергей, очень признателен за ссылки на приложения распознавания речи.
Для меня тема по прежнему актуальна. Попробовал Speechpad.ru.
Первое впечатление — замечательный продукт, полностью соответствующей моей потребности.
При моей тугоухости — просто панацея. Передаю микрофон собеседнику и в своем смартфоне вижу текст, практически без искажений. Давно отслеживаю прогресс Google translate для получения титров на youtube. Однако здесь эта технология реализована в очень удачной форме для использования людьми имеющими большие проблемы со слухом.

Очень рад, что информация из статьи Вам пригодилась!

Уважаемый автор статьи, хочу спросить Вашего совета или рекомендации по интересующей меня жизненно важной теме. Я слабослышащий (проблемы распознавания речи), современные цифровые са проблему не решают, начал искать подходящее приложение для гаджета (или бм специализированный гаджет) позволяющее видеть на экране гаджета в on line речь собеседника (как непосредственного, так и контактирующего по каналам связи (телефон, WiFi и пр.).
Что мне можете посоветовать ?
Марк Михайлович
Надеюсь на конструктивный ответ.

С подобными устройствами и программными средствами не знаком.

Посмотрите приложение Яндекс.Разговор для смартфона на Android. Его ещё в 2015г. запустили.

ЕWA , Speechpad.ru работает с Latviešu, Lietuviešu (Латышский, Литовский) и другими языками. Но надо диктовать чётко и медленно, так как в школе диктанты учителя диктуют детям. И микрофон надо хороший, тогда всё тип топ.

Однако,если темп речи средний,то программа ничего не распознает. Обидно(

Вообще то я скачал всё это для того чтобы иметь возможность РАСПОЗНАВАНИЯ звучащего видео тогда когда язык его мне неизвестен. Через гугл мне долго предлагали всякую дрянь, которая якобы может это сделать. Вот кажется и эта не работает.

Что вы скачивали, если речь в статье идет про онлайн сервисы?

Сергей, скажите, пожалуйста, можно ли получить код, чтобы вставить ваш продукт на свой сайт для некоммерческого использования? Заодно мы сможем провести многоуровневое тестирование (если надо, конечно)

Татьяна Борисовна, сервисы распознавания речи это не мой продукт. Я всего лишь пишу обзоры. Обратитесь к владельцу этих ресурсов.

А если сервисом пользоваться для написания книг, то авторские права идут лесом, наверное?

Какая тут взаимосвязь вообще?

Для написания книг используйте VOCO, работает без доступа к сети. Если успеете написать книгу за 30 дней, тоже получится бесплатно.

Уважаемый Сергей. А нет ли какого-нибудь бесплатного онлайн сервиса преобразования аудио в текст без браузера Гугл Хром? Я боюсь скачивать этот браузер, у меня уже один комп накрылся, потому что там какой-то скрипт проблемный. Помогите, пожалуйста.

Никакой проблемы с Гугл Хромом нет — скачивайте спокойно.

Смените хром на его аналог без шпионских модулей — Comodo Dragon.

Здравствуйте, друзья. Сегодня последняя статья из серии про профессию транскрибатор, в которой я расскажу, как новичку сделать транскрибацию максимально просто и быстро.

Показывать буду на примере одной из программ для транскрибации, о которых мы вчера разговаривали. Также приведу интересный способ, как можно делать расшифровку записей в текст с помощью распознавания речи.

Способ 1

Express Scribe — это профессиональная программа, которой пользуются практически все, кто занимается переводом аудио- и видеозаписей. Она имеет все необходимые функции, которые требуются.

После установки данной программы и запуска, вы увидите такое окно.

Она, к сожалению, не имеет интерфейса на русском языке, но в ней и так всё понятно и настроек особых не требуется. Просто установите её и работайте.

Удобство этой программы заключается в том, что не нужно переключаться между окнами проигрывателя и текстовым документом, прослушивать запись и набирать текст можно сразу в одном месте.

Шаг 1. Чтобы загрузить свои файлы, которые нужно транскрибировать, нажмите кнопку «Load» или просто перетащите их из вашей папки, где они лежат, в самое верхнее окно.

Шаг 2. Изучите или напишите себе шпаргалку, какие горячие клавиши вам потребуются в работе.

Стандартные настройки горячих клавиш:

  • F9 — воспроизведение записи.
  • F4 — пауза.
  • F10 — воспроизведение с обычной скоростью.
  • F2 — воспроизведение на низкой скорости (50%).
  • F3 — воспроизведение на высокой скорости (150%).
  • F7 — перемотка назад.
  • F8 — перемотка вперёд.

Удобно, что клавиши воспроизведения и паузы настроены под разные руки, и через некоторое время мышечная память их легко запомнит.

Шаг 3. В нижнем правом углу программы установите комфортную для вас скорость проигрывания записи. Можно замедлить до такого состояния, чтобы успевать печатать, не делая паузу.

Шаг 4. Можно начинать делать транскрибацию.

Также для записи вы можете отрегулировать каналы аудио, чтобы звук был лучше и понятнее, просто включите запись и подвигайте шкалы до лучшего качества.

Шаг 5. После того, как вы сделали перевод из аудио в текст, скопируйте получившийся текст в документ Word для сохранения и последующего его редактирования.

Способ 2

Второй способ заключается в том, чтобы не набирать текст на клавиатуре самостоятельно, а чтобы он набирался автоматически с помощью сервисов распознавания голоса.

То есть вы слушаете отрывки записи и голосом их пересказываете или ещё проще, включаете запись на колонках, если качество хорошее, и запускаете функцию голосового ввода.

Я рекомендую использовать сервис Speechpad или обычные Google документы.

В Гугл документах эта функция находится во вкладке «Инструменты» -> «Голосовой ввод. » или запускается сочетанием клавиш CTRL+SHIFT+S.

Заключение

Вот такие два совершенно простых способа, которые помогут вам сделать транскрибацию и заработать (для кого-то первые) деньги через интернет.

Профессия «транскрибатор» очень простая и с ней может справиться каждый, поэтому здесь не так много можно зарабатывать. Я рекомендую вам ознакомиться с другими интересными специальностями в книге «7 профессий в интернете», на которую я недавно делал обзор.

Если у вас возникли ко мне какие-то вопросы или пожелания, то всегда можете написать их мне ниже в комментариях к этой статье. Желаю удачи в освоении данного направления и хороших доходов в удалённой работе!

Serpstat использует файлы cookie для обеспечения работоспособности сервиса, улучшения навигации, предоставления возможности связаться с командой поддержки, а также маркетинговых активностей Serpstat.

Нажав кнопку "Принять и продолжить", вы соглашаетесь с Политики конфиденциальности

How-to– Читать 4 минуты –9 января 2019

Не каждый посетитель вашего сайта может здесь и сейчас посмотреть или прослушать видеозапись. У кого-то медленный интернет, а кому-то некомфортно включать громкое воспроизведение. Некоторые и вовсе лучше воспринимают информацию через текст, а не видео.

По этой причине лучше отключить автовоспроизведение аудио-, видеофайлов на страницах сайта и дать возможность читать текст аналогичного содержания.

Поисковым роботам также проще воспринимать информацию в виде печатного текста, чем в формате видеозаписи. Для улучшения индексации выполняйте транскрибацию всех таких файлов на вашем сайте.

Во многих бесплатных программах есть опция перевода аудиозаписи в текст. Но ждать точного результата от таких сервисов не стоит. Ведь звуковые записи редко бывают чистыми без фоновых шумов, дефектов речи, акцента. Поэтому в большинстве случаев придется вручную дорабатывать материал, полученный после преобразования аудиозаписи в текст.

Конвертер аудио в текст можно установить на компьютер или смартфон, используя версии для Android или iOS. Обратите внимание: некоторые программы требуют бесперебойного подключения к сети, а другие могут работать без интернета.

Рассмотрим на примере функционал Speechpad. При открытии главной страницы этого онлайн-сервиса вы увидите такой интерфейс:

Оцените статью
Ремонт оргтехники
Добавить комментарий