преображение голоса в текст
Как превратить голос в текст: тестируем 5 сервисов для расшифровки
Я работаю с текстом и мечтаю о программе, которая сможет превратить голос в напечатанные слова.
Например, расшифрует за меня интервью длиной в несколько часов. Или позволит наговорить идеи, а в ответ пришлет заметку. Наконец, «напишет» за меня смс: поймет несколько обрывистых фраз и отправит адресату текст — потому что голосовые сообщения любят не все.
Я протестировал 5 таких сервисов: наговорил один и тот же текст, а потом сравнил результаты. Я использовал два способа: сначала давал программе послушать и расшифровать живой голос, а потом — в записи.
Текст для теста
Вот текст для теста: «Привет. Это тестовая запись для статьи об инструментах, которые умеют превращать голос в текст. Как думаете, этот сервис справится? Распознает интонацию вопроса и, например, числа — один, два, три? Вот что получилось».
Google Keep
Где работает: Android, iOS
Сколько стоит: бесплатно
Что умеет. Это приложение для создания и хранения заметок можно использовать как расшифровщик. Если на главном экране нажать на иконку микрофона и начать говорить, то сервис будет переводить звук в текст — это называется транскрибацией. Загрузить и расшифровать аудиофайл не получится.
У сервиса есть еще один минус: запись останавливается, если молчать две-три секунды, поэтому расшифровывать длинные интервью не получится. Разве что делать это небольшими кусками. Наговорить несколько идей и получить их в блокноте получится отлично.
Результат. Я проверил два способа: наговорил текст самостоятельно и включил запись того же текста через колонку — никакой разницы нет. Вышло хорошо: сервис не распознал только знаки препинания и напечатал числа без пробелов.
Сообщения «Вконтакте»
Где работает: Android, iOS
Сколько стоит: бесплатно
Что умеет. В мобильном приложении соцсеть умеет расшифровывать входящие голосовые сообщения. Это можно использовать и в наших целях: отправлять сообщения самому себе.
Для этого зайдите в раздел с диалогами и в поисковом окне вбейте свое имя. Дальше зажмите значок микрофона и наговорите сообщение. Когда оно появится в диалоговом окне, нажмите на «Аа» справа от записи.
Результат. «Вконтакте» расшифровал живой голос с ошибками в склонениях и перепутал несколько слов: например, «сервис» услышал как «серый». Но справился с числами. Записанный и пропущенный через колонку голос сервис расшифровал намного хуже — получился набор слов, который нужно буквально переписывать.
Голосовой ввод текста: топ-5 бесплатных инструментов
Если вы работаете в digital-маркетинге, вам постоянно нужно взаимодействовать с текстом: записывать идеи, задачи, описывать концепции, писать статьи и многое другое. Иногда проще и быстрее надиктовать текст, чтобы не забыть важную мысль или задачу. Диктофон для этого подходит плохо: запись потом нужно будет расшифровывать и переводить в текст. А если оставлять голосовые заметки часто, то потом просто нереально быстро найти нужную информацию или бегло ее просмотреть.
Голосовой ввод текста помогает решить эту проблему. Вы диктуете — программа сразу переводит речь в текст, который вы можете сохранить как обычную заметку и дальше работать с ней спокойно работать.
В статье мы собрали подборку бесплатных сервисов голосового ввода, которые помогут вам:
Берите на вооружение сервисы из подборки и тестируйте — все они бесплатные и неплохо распознают русский язык.
5 бесплатных онлайн-сервисов для голосового ввода
1. SpeechPad
Speechpad — бесплатный сервис для голосового ввода текста. Доступен в трех форматах:
У сервиса также есть платные функции. Их два вида:
Онлайн-сервис
Интерфейс сервиса выглядит так:
Здесь есть несколько настроек, кнопки управления и поле, в котором отображается распознаваемый текст.
Что можно сделать сделать:
Обратите внимание! Онлайн-сервис Speechpad корректно работает только в браузере Google Chrome. Можно запускать его и в Яндекс.Браузере, но все же для корректной работы рекомендуется использовать именно Chrome.
Для начала распознавания текста нажмите кнопку «Включить запись» и предоставьте доступ к микрофону.
Затем надиктовывайте текст. Сначала распознанные слова появятся в поле справа от кнопки «Включить запись». После небольшой паузы они попадут в поле ниже (результирующее поле).
Над результирующем полем есть кнопки со знаками пунктуации. По ходу диктовки вы можете добавлять их вручную.
После того как вы закончили диктовку, просмотрите текст, исправьте ошибки (если есть). Затем скопируйте текст или скачайте в виде txt-файла.
Транскрибация
Также с помощью Speechpad можно переводить аудиозаписи разговоров в текст с помощью опции «Транскрибация».
Здесь можно будет загрузить аудио- или видеофайл, а также добавить ссылку на видео с Youtube.
После нажатия на кнопку «Включить запись» файл начнет проигрываться и система переведет речь в текст.
Расширение SpeechPad
Установите расширение из магазина расширений Google Chrome. После установки в контекстном меню в браузере (при клике правой кнопкой мыши на любой области экрана) появится пункт «SpeechPad».
Кликните правой кнопкой мыши по любому полю для ввода текста и выберите расширение из контекстного меню. Поле подсветится, и вы сможете голосом произнести фразу, которую нужно ввести в поле. Расширение распознает ее и отобразит в виде текста.
Мобильное приложение
Доступно две версии: для Android и iOS.
Приложение может работать в автономном режиме (без подключения к интернету). Так выглядит интерфейс приложения на Android:
В настройках можно управлять голосовыми командами (для расстановки знаков препинания и спецсимволов с помощью голоса):
2. VoiceNote
VoiceNote — еще один сервис для преобразования голоса в текст, который работает только в Google Chrome (также может работать в Яндекс.Браузере). При попытке запустить его в другом браузере появляется сообщение об ошибке.
Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.
Как пользоваться сервисом
Откройте редактор и выберите язык, на котором нужно распознавать речь. Для этого кликните по иконке земного шара и укажите нужный язык.
Затем кликните по значку микрофона и предоставьте сервису доступ к микрофону вашего компьютера или ноутбука.
После этого система начнет запись и вы сможете надиктовывать текст. Распознанный текст появится в редакторе. Возможности:
3. Voice Notepad
Еще один сервис для голосового ввода текста. Как и остальные сервисы, работает только в браузере Google Chrome.
У сервиса простой интерфейс. Здесь есть:
Сервис поддерживает голосовые команды. Например, с помощью команды можно перевести текст на новую строку, поставить тире или другие знаки препинания, спецсимволы и т. д.
Полный список поддерживаемых команд для русского языка — здесь.
4. Speechtexter.com
Бесплатный онлайн-сервис для распознавания речи. Достаточно неплохо распознает русский язык. Всего поддерживает более 60 языков.
У SpeechTexter есть веб-версия (работает только в Google Chrome) и мобильное приложение для Android.
Для начала работы с сервисом необходимо выбрать язык распознавания и нажать кнопку Start (предоставив доступ к микрофону).
В текстовом поле есть несколько полезных функций:
В правой части интерфейса размещен блок со стандартными голосовыми командами для добавления знаков препинания и нового абзаца:
На вкладке Custom можно создать свои команды, например для добавления кавычек.
После завершения диктовки текст можно отредактировать и сохранить в файле:
5. TalkTyper
Простой онлайн-сервис для голосового ввода с поддержкой 37 языков.
В этом сервисе минимум функций, однако с распознаванием русского языка он справляется вполне неплохо. Для начала распознавания речи необходимо нажать на значок микрофона, разрешить его использование в браузере и начать диктовку текста.
Если сервис распознал фразу неправильно, нажмите на значок «Варианты»:
Если среди предложенных вариантов нет правильного, текст можно поправить вручную.
После завершения распознавания вы можете сохранить текст в txt-файле, скопировать, распечатать или отправить на почту.
Дополнительные инструменты для голосового ввода текста
Яндекс.Клавиатура и GBoard (Google Клавиатура)
Если вы большую часть времени работаете со смартфона и хотите использовать возможность голосового ввода текста, воспользуйтесь функционалом голосового ввода, который есть в клавиатурах от Google и Яндекс:
Так вы сможете надиктовывать текст в любом приложении, которое вы обычно используете для организации личных и рабочих заметок, задач и подобного (Google Keep, Notion, Trello и т. д.).
Воспользоваться голосовым вводом просто:
Голосовой ввод на GBoard (клавиатуре от Google)
Google Docs
Тем, кто много работает с Google Документами, пригодится встроенная функция голосового ввода (поддерживает русский язык).
Если вы еще не знали о ней, вот как ее включить: «Инструменты» → «Голосовой ввод».
Слева появится всплывающее окошко с выпадающим списком для выбора языка речи и кнопкой с иконкой микрофона.
Выберите нужный язык, нажмите на кнопку и начните диктовать текст.
Рекомендации, которые помогут улучшить качество распознавания текста
Все сервисы, которые мы привели в подборке, достаточно хорошо распознают русский язык, однако иногда качество распознанного текста может быть посредственным. Чтобы такого не происходило, следуйте нескольким базовым рекомендациям.
Соблюдайте эти рекомендации и необходимость правок будет минимальной.