преображение голоса в текст

Как превратить голос в текст: тестируем 5 сервисов для расшифровки

Я работаю с текстом и мечтаю о программе, которая сможет превратить голос в напечатанные слова.

Например, расшифрует за меня интервью длиной в несколько часов. Или позволит наговорить идеи, а в ответ пришлет заметку. Наконец, «напишет» за меня смс: поймет несколько обрывистых фраз и отправит адресату текст — потому что голосовые сообщения любят не все.

Я протестировал 5 таких сервисов: наговорил один и тот же текст, а потом сравнил результаты. Я использовал два способа: сначала давал программе послушать и расшифровать живой голос, а потом — в записи.

Текст для теста

Вот текст для теста: «Привет. Это тестовая запись для статьи об инструментах, которые умеют превращать голос в текст. Как думаете, этот сервис справится? Распознает интонацию вопроса и, например, числа — один, два, три? Вот что получилось».

Google Keep

Где работает: Android, iOS
Сколько стоит: бесплатно

Что умеет. Это приложение для создания и хранения заметок можно использовать как расшифровщик. Если на главном экране нажать на иконку микрофона и начать говорить, то сервис будет переводить звук в текст — это называется транскрибацией. Загрузить и расшифровать аудиофайл не получится.

У сервиса есть еще один минус: запись останавливается, если молчать две-три секунды, поэтому расшифровывать длинные интервью не получится. Разве что делать это небольшими кусками. Наговорить несколько идей и получить их в блокноте получится отлично.

Результат. Я проверил два способа: наговорил текст самостоятельно и включил запись того же текста через колонку — никакой разницы нет. Вышло хорошо: сервис не распознал только знаки препинания и напечатал числа без пробелов.

Сообщения «Вконтакте»

Где работает: Android, iOS
Сколько стоит: бесплатно

Что умеет. В мобильном приложении соцсеть умеет расшифровывать входящие голосовые сообщения. Это можно использовать и в наших целях: отправлять сообщения самому себе.

Для этого зайдите в раздел с диалогами и в поисковом окне вбейте свое имя. Дальше зажмите значок микрофона и наговорите сообщение. Когда оно появится в диалоговом окне, нажмите на «Аа» справа от записи.

Результат. «Вконтакте» расшифровал живой голос с ошибками в склонениях и перепутал несколько слов: например, «сервис» услышал как «серый». Но справился с числами. Записанный и пропущенный через колонку голос сервис расшифровал намного хуже — получился набор слов, который нужно буквально переписывать.

Источник

Голосовой ввод текста: топ-5 бесплатных инструментов

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Если вы работаете в digital-маркетинге, вам постоянно нужно взаимодействовать с текстом: записывать идеи, задачи, описывать концепции, писать статьи и многое другое. Иногда проще и быстрее надиктовать текст, чтобы не забыть важную мысль или задачу. Диктофон для этого подходит плохо: запись потом нужно будет расшифровывать и переводить в текст. А если оставлять голосовые заметки часто, то потом просто нереально быстро найти нужную информацию или бегло ее просмотреть.

Голосовой ввод текста помогает решить эту проблему. Вы диктуете — программа сразу переводит речь в текст, который вы можете сохранить как обычную заметку и дальше работать с ней спокойно работать.

В статье мы собрали подборку бесплатных сервисов голосового ввода, которые помогут вам:

Берите на вооружение сервисы из подборки и тестируйте — все они бесплатные и неплохо распознают русский язык.

5 бесплатных онлайн-сервисов для голосового ввода

1. SpeechPad

Speechpad — бесплатный сервис для голосового ввода текста. Доступен в трех форматах:

У сервиса также есть платные функции. Их два вида:

Онлайн-сервис

Интерфейс сервиса выглядит так:

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Здесь есть несколько настроек, кнопки управления и поле, в котором отображается распознаваемый текст.

Что можно сделать сделать:

Обратите внимание! Онлайн-сервис Speechpad корректно работает только в браузере Google Chrome. Можно запускать его и в Яндекс.Браузере, но все же для корректной работы рекомендуется использовать именно Chrome.

Для начала распознавания текста нажмите кнопку «Включить запись» и предоставьте доступ к микрофону.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Затем надиктовывайте текст. Сначала распознанные слова появятся в поле справа от кнопки «Включить запись». После небольшой паузы они попадут в поле ниже (результирующее поле).

Над результирующем полем есть кнопки со знаками пунктуации. По ходу диктовки вы можете добавлять их вручную.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

После того как вы закончили диктовку, просмотрите текст, исправьте ошибки (если есть). Затем скопируйте текст или скачайте в виде txt-файла.

Транскрибация

Также с помощью Speechpad можно переводить аудиозаписи разговоров в текст с помощью опции «Транскрибация».

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Здесь можно будет загрузить аудио- или видеофайл, а также добавить ссылку на видео с Youtube.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

После нажатия на кнопку «Включить запись» файл начнет проигрываться и система переведет речь в текст.

Расширение SpeechPad

Установите расширение из магазина расширений Google Chrome. После установки в контекстном меню в браузере (при клике правой кнопкой мыши на любой области экрана) появится пункт «SpeechPad».

Кликните правой кнопкой мыши по любому полю для ввода текста и выберите расширение из контекстного меню. Поле подсветится, и вы сможете голосом произнести фразу, которую нужно ввести в поле. Расширение распознает ее и отобразит в виде текста.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Мобильное приложение

Доступно две версии: для Android и iOS.

Приложение может работать в автономном режиме (без подключения к интернету). Так выглядит интерфейс приложения на Android:

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

В настройках можно управлять голосовыми командами (для расстановки знаков препинания и спецсимволов с помощью голоса):

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

2. VoiceNote

VoiceNote — еще один сервис для преобразования голоса в текст, который работает только в Google Chrome (также может работать в Яндекс.Браузере). При попытке запустить его в другом браузере появляется сообщение об ошибке.

Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.

Как пользоваться сервисом

Откройте редактор и выберите язык, на котором нужно распознавать речь. Для этого кликните по иконке земного шара и укажите нужный язык.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Затем кликните по значку микрофона и предоставьте сервису доступ к микрофону вашего компьютера или ноутбука.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

После этого система начнет запись и вы сможете надиктовывать текст. Распознанный текст появится в редакторе. Возможности:

3. Voice Notepad

Еще один сервис для голосового ввода текста. Как и остальные сервисы, работает только в браузере Google Chrome.

У сервиса простой интерфейс. Здесь есть:

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Сервис поддерживает голосовые команды. Например, с помощью команды можно перевести текст на новую строку, поставить тире или другие знаки препинания, спецсимволы и т. д.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Полный список поддерживаемых команд для русского языка — здесь.

4. Speechtexter.com

Бесплатный онлайн-сервис для распознавания речи. Достаточно неплохо распознает русский язык. Всего поддерживает более 60 языков.

У SpeechTexter есть веб-версия (работает только в Google Chrome) и мобильное приложение для Android.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Для начала работы с сервисом необходимо выбрать язык распознавания и нажать кнопку Start (предоставив доступ к микрофону).

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

В текстовом поле есть несколько полезных функций:

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

В правой части интерфейса размещен блок со стандартными голосовыми командами для добавления знаков препинания и нового абзаца:

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

На вкладке Custom можно создать свои команды, например для добавления кавычек.

После завершения диктовки текст можно отредактировать и сохранить в файле:

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

5. TalkTyper

Простой онлайн-сервис для голосового ввода с поддержкой 37 языков.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

В этом сервисе минимум функций, однако с распознаванием русского языка он справляется вполне неплохо. Для начала распознавания речи необходимо нажать на значок микрофона, разрешить его использование в браузере и начать диктовку текста.

Если сервис распознал фразу неправильно, нажмите на значок «Варианты»:

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Если среди предложенных вариантов нет правильного, текст можно поправить вручную.

После завершения распознавания вы можете сохранить текст в txt-файле, скопировать, распечатать или отправить на почту.

Дополнительные инструменты для голосового ввода текста

Яндекс.Клавиатура и GBoard (Google Клавиатура)

Если вы большую часть времени работаете со смартфона и хотите использовать возможность голосового ввода текста, воспользуйтесь функционалом голосового ввода, который есть в клавиатурах от Google и Яндекс:

Так вы сможете надиктовывать текст в любом приложении, которое вы обычно используете для организации личных и рабочих заметок, задач и подобного (Google Keep, Notion, Trello и т. д.).

Воспользоваться голосовым вводом просто:

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Голосовой ввод на GBoard (клавиатуре от Google)

Google Docs

Тем, кто много работает с Google Документами, пригодится встроенная функция голосового ввода (поддерживает русский язык).

Если вы еще не знали о ней, вот как ее включить: «Инструменты» → «Голосовой ввод».

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Слева появится всплывающее окошко с выпадающим списком для выбора языка речи и кнопкой с иконкой микрофона.

преображение голоса в текст. image loader. преображение голоса в текст фото. преображение голоса в текст-image loader. картинка преображение голоса в текст. картинка image loader.

Выберите нужный язык, нажмите на кнопку и начните диктовать текст.

Рекомендации, которые помогут улучшить качество распознавания текста

Все сервисы, которые мы привели в подборке, достаточно хорошо распознают русский язык, однако иногда качество распознанного текста может быть посредственным. Чтобы такого не происходило, следуйте нескольким базовым рекомендациям.

Соблюдайте эти рекомендации и необходимость правок будет минимальной.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *