Голосовой блокнот яндекс. Голосовой поиск

Статьи и Лайфхаки

Далеко не каждый пользователь в курсе, что существует голосовой набор на андроид, как включить эту функцию тоже представляют себе не все. А ведь если посмотреть , перечень выпущенных моделей, становится ясно, что практически каждое современное устройство оснащено ею. Расскажем, как начать применять голосовой набор, используя стандартные варианты, предложенные системой, или же сторонние приложения.

Базовый ввод голосовых команд предполагает диктовку текста своему мобильному устройству без использования клавиш. Чтобы иметь возможность использовать данную функцию, необходимо проделать несколько простых и последовательных действий. Начнём с того, что поместим курсор в любое поле для ввода текста. Нам будет предложено использование клавиатуры Android. Находим рисунок микрофона и нажимаем на него. Перед нами появится панель для голосового ввода, где будут несколько важных элементов, включая список языков, голосовой индикатор и клавишу «Готово», на английском «Done» (переводит в обычный текстовый режим).

По умолчанию на одном из рабочих столов нашего смартфона установлен виджет поиска Google, где также есть иконка с изображением микрофона. Путём нажатия на неё мы сможем активировать функцию голосового набора.

Как управлять этой функцией? Следует знать о том, что красная рамка, находящаяся вокруг рисунка микрофона, меняет свою толщину в зависимости от того, насколько громким является наш голос. По мере обработки команд они будут появляться в виде слов в поле.

Добавим, что функция работает только при активном подключении к Интернету. Язык ввода выбирается в специальном поле («Select dictation language» > «Add languages», то есть «Добавить языки»). Теперь можно пользоваться голосовым набором без каких-либо проблем.

Теперь мы имеем представление о том, что такое голосовой набор на андроид, как включить его и как им пользоваться. Однако следует знать, что активировать эту функцию можно теми же путями, : т. е. не только встроенными средствами системы, но и при помощи сторонних программ.

Неплохой программой является Voice Button. Её можно найти и загрузить из Play Market. Это хорошее приложение для голосового управления всей домашней техникой. Оно построено на основе базового модуля сотового аппарата Android, а также модуля Arduino.

После самого первого запуска приложения переходим в «Настройки» («Settings»), после чего выбираем «Пожалуйста, нажимайте и говорите» («Please click and tell»). Откроется окно с изображением микрофона. Произносимые нами голосовые команды будут появляться в верхнем поле. Чтобы сохранить какую-либо команду и привязать её к определённой кнопке, стоит нажать на эту кнопку с надписью «Изменить голосовую команду №» («Change Voice command №»). Текст команды будет отображаться в скобках.

Ещё одной хорошей программой является Cyberon Voice Commander. Она отличается высокой степенью точности. Приложение позволяет совершать исходящие звонки, запускать другие программы и т.д. Функция голосового набора сопряжена с беспроводной Bluetooth гарнитурой.

Недостатком этого приложения является то, что оно предлагается на платной основе. Его цена составляет $5,99.

Одной из полезных функций в Android является голосовой набор. Научившись умело его использовать, можно сэкономить немало времени и выполнять множество операций, не прибегая к стандартной клавиатуре.

Такой вид набора даст возможность не отвлекаться на нажатие порой очень мелких клавиш. Это очень удобно, к примеру, когда вы находитесь за рулем автомобиля. Чтобы произвести необходимые действия, необходимо всего лишь продиктовать свои указания устройству. Но этому предшествует несколько элементарных действий, которые необходимо осуществить заранее.

Для начала следует поместить курсор таким образом, чтобы всплыла стандартная клавиатура. Кликните на изображение микрофона, и устройство перейдет в режим голосового ввода. Данное действие выполняется по-разному в зависимости от устройства и версии системы. В большинстве случаев нужно найти на одной из кнопок (пробеле или смене языка) значок микрофона и зажать ее.


После этих действий на экране появится готовая к применению панель ввода голосом. Использовать ее можно не только для вызовов или наборов SMS-сообщений, но и в браузере. Это очень удобно, особенно когда необходимо набрать длинное сообщение для отправки или любой другой текст.

В этот момент на экране устройства будет индикатор в виде микрофона. Внимательно следите за красной рамкой вокруг него. Ее толщина свидетельствует о громкости вашего голоса. После произнесения слова, оно будет мгновенно обработано и распознано, после чего высветится в специальном поле.

Распознавание речи - технология, позволяющая значительно повысить продуктивность как на работе, так и дома. Надиктовать документ можно в три раза быстрее, чем напечатать его.

Распознавание речи онлайн

Чтобы преобразовать речь в текст, можно воспользоваться соответствующим онлайн-сервисом в браузере. Сайты по распознаванию речи, как правило, не требуют регистрации и оплаты, они очень удобны в использовании. В первую очередь, потребуется установить браузер Google Chrome. Это связано с тем, что все сервисы работают на одном и том же движке распознавания речи от Гугл. Качество распознавания зависит от микрофона, а также ритма и четкости речи.

Читайте также: Включение микрофона на Windows 8

Способ 1: Speechnotes

Спичноутс - самый популярный сервис по распознаванию речи онлайн, предоставляющий большой выбор языков, расширенные возможности постановки знаков препинания и отправки надиктованного текста в сторонние приложения.

Онлайн-сервис Speechnotes

Порядок действий:

    1. Нажмите на иконку микрофона справа.
    2. Выберите «Разрешить» во всплывающем окне браузера. Слева над иконкой микрофона появится мигающий красный кружок - это означает, что запись включена.


    1. Выберите русский язык из выпадающего меню.


    1. Начните диктовать.
    2. Чтобы остановить запись, снова нажмите на иконку микрофона.
    3. Скопируйте текст в буфер обмена (А) или отправьте в сторонние сервисы, используя панель инструментов слева (B).


Для расстановки знаков препинания есть три способа:

    1. Диктовка: справа есть перечень знаков с соответствующим произношением;


    1. Набор на клавиатуре - самый быстрый способ, так как добавляет знак еще до того, как заканчивается речь. Здесь главное дождаться, пока надиктованная речь появится в буфере (см. скриншот) и только после этого нажимать кнопку, иначе знак препинания появится перед надиктованной речью, а не после;


  1. Кнопка на сайте - достаточно нажать соответствующий знак препинания в панели справа (см. пункт 1).

Результаты распознавания во многом будут зависеть от качества микрофона и диктовки. Для наилучшего результата говорить нужно медленно и четко. Это относится ко всем сервисам по распознаванию речи.

Способ 2: Speechlogger

Спичлоггер - многофункциональный сервис по распознаванию речи, с помощью которого можно не только диктовать тексты, но и переводить их на другие языки в режиме реального времени с Google Translate, а также транскрибировать аудиофайлы.

Онлайн-сервис Speechlogger

Чтобы начать запись на сайте Speechlogger, выполните следующие действия:

    1. Зайдите на сайт, прокрутите немного вниз до блока с голубым фоном и нажмите на иконку микрофона.
    2. Выберите «Разрешить» .
    3. Найдите в списке русский язык, если это необходимо.
    4. Нажмите на кнопку справа вверху, чтобы блок распознавания речи занимал весь экран (это не обязательно, но так удобнее работать).


    1. Начинайте диктовать.
    2. Текст, в котором может быть ошибка, выделяется красным цветом. Это позволяет быстрее находить неточности и исправлять их.


    1. После того, как работа закончена, снова нажмите на иконку микрофона.
    2. Выделите весь текст с помощью кнопки All (A) и скопируйте, нажав правой кнопкой мыши и выбрав «Копировать» (сочетание клавиш Ctrl+C не работает), либо воспользуйтесь панелью инструментов (B), чтобы отправить текст по электронной почте, сохранить в формате.txt, .doc, загрузить на Google Drive или распечатать.


Способы постановки знаков препинания:

    1. Диктовка: чтобы узнать, как произносить тот или иной знак препинания, наведите на него курсор - во всплывающем окне появится подсказка.
    2. Просто нажмите на знак препинания в панели, расположенной над областью для текста.


    1. Автопунктуация: на сайте можно задать настройки для автоматической постановки знаков препинания. Не очень удобный вариант, так как при каждой паузе система ставит точку, при этом русский язык слишком гибкий и многообразный - задать четкие условия для постановки определенных знаков препинания невозможно. Поэтому рекомендуется отключить эту функцию, убрав соответствующую галочку.


Дополнительные настройки расположены в верхнем левом углу.


С их помощью можно включить или отключить следующие функции:

    • Автосохранение текста: если функция включена, доступ ко всем сессиям можно получить, нажав на иконку папки в панели инструментов;


  • Выделение слов красным шрифтом;
  • Отметки времени в тексте (включены по умолчанию).

Кроме того, можно задать настройки для автопунктуации и изменить цвет фона.

Способ 3: Online Dictation

Online Dictation - удобный сервис с лаконичным интерфейсом. Основное преимущество - простота в использовании.

Онлайн-сервис Dictation

    1. Сервис автоматически определяет язык по умолчанию, настроенный в браузере. Если язык не установлен либо используется гостевая учетная запись Chrome, необходимо установить русский: выпадающий список языков расположен внизу под областью для текста.


    1. Нажмите кнопку «Start Dictation» .


    1. Разрешите использование микрофона на сайте.


    1. Начинайте диктовать. Для постановки знаков препинания используйте голосовые команды: «точка», «запятая», «вопросительный знак», «восклицательный знак», остальные знаки ставятся при помощи клавиатуры. Для начала нового абзаца действует голосовая команда «новый параграф», для перехода на новую строку - «новая строка».
    2. Закончив диктовать, нажмите «Stop Listening» .


  1. После того как текст готов, его можно:
    • Скопировать, нажав кнопку «Copy» (1);
    • Сохранить в формате.txt, нажав кнопку «Save» (2);
    • Стереть, нажав кнопку «Clear» (3).


Способ 4: SpeechTexter

Сервис по распознаванию речи СпичТекстер отличается красивым компактным дизайном и позволяет редактировать текст прямо на сайте. Форматирование сохраняется при переносе текста в сторонний редактор.

Онлайн-сервис SpeechTexter

    1. Для прекращения записи нажмите «Stop» .


    1. После того, как текст записан, его можно отформатировать, используя инструменты на панели, расположенной над текстом.


    1. Готовый текст можно скопировать (1), сохранить в формате.txt (2) или распечатать (3).


Код для вставки на сайт.

Совет: можно изменить свойство recognition.lang и подставить ‘ru-RU’ вместо ‘en-US’, тогда по умолчанию устанавливается русский язык.

У каждого из сервисов есть свои преимущества и недостатки. Рекомендуется попробовать поработать на каждом из них и выбрать наиболее подходящий, исходя из своих целей и предпочтений.

Сейчас без компьютера просто нереально обойтись в современном мире. От вас не требуется быть мастером фотошопа или профессионально монтировать видео (если это не связано с работой, конечно). Но суметь набрать какой-нибудь текст – это необходимый минимум.

№2. Web Speech API


Онлайн-программа Web Speech API по функционалу абсолютно идентична предыдущим.

Этот сервис, как и перечисленные выше, также был создан компанией Google.

Главная страница выглядит так:


В простом интерфейсе сразу очевидно, что для начала записи необходимо выбрать язык, а после нажать на микрофон.

После того как вы нажмете на значок справа, система обязательно сделает запрос на доступ.


После того как вы «дадите добро», можно сразу приступать к работе. Набирайте текст голосом, а его печатная версия будет появляться в окошке.

После окончания работы текст можно скопировать туда, куда вам необходимо (опять же таки – ctrl+C, ctrl+V).

№3. Talktyper

Не менее простая программа – это Talktyper.

Для начала работы перейдите на сайт: https://talktyper.com/ru/index.html.


Для начала работы достаточно нажать на значок микрофона справа.

В отличие от описанных выше, данный наборщик текста можно открывать с помощью любого браузера. Хотя сайт создан в США, приложение легко распознает самые популярные языки мира, в том числе и русский.

Talktyper многофункциональный: он не только набирает текст, но и ставит знаки препинания, исправляет самостоятельно ошибки. Если какое-то начитанное вами слово система не может распознать, как правильное, то оно обязательно высветится.

Кроме того, Talktyper имеет функцию перевода, а также его озвучивания.

Обратите внимание! После того как вы закончите голосовой набор текста, обязательно нажмите на стрелочку, чтобы набранный документ был перенесен в другое поле. После этого его можно будет отправить по электронной почте или скопировать в нужный файл.

Возможные проблемы при работе с программами голосового набора

Когда вы начнете использовать эти программы, то обязательно задумаетесь, как же компьютер распознает наш голос, а после еще переводит в живой текст.

Схема распознавания речи устройством выглядит так:

Весь процесс можно разделить на 3 главных этапа:

    Акустический распознаватель.

    Важно говорить четко, громко, микрофон должен передавать голос без перебоев.

    Лингвистическая обработка.

    Чем больше в словаре программы есть слов, тем качественнее будет набранный текст. То есть, все вами сказанное будет опознаваться и передаваться в текстовом виде без искажения.

    Распознанный орфографический текст.

    Программа в автоматическом режиме выводит на экран орфографическую версию надиктованной речи, опираясь на паузы, четкость слов, найденные лексемы в словаре и т.д.

При работе с компьютерными наборщиками текста чаще всего возникает 2 проблемы:

  1. Акустический распознаватель «улавливает» вашу речь с перебоями.
  2. В словаре системы недостаточно слов, чтобы распознать всё, сказанное вами.

Чтобы решить первую проблему, необходимо четко и громко говорить. А вот для второй проблемы решения практически не существует, по крайней мере, бесплатного.

Версии программ распознавания речи, которые распространяются свободно, имеют очень скупой словарный запас.

Чтобы обеспечить программе обширный запас слов разработчикам требуется вложить немало денег, поэтому многие распознаватели демонстрируют низкий уровень перевода речи в текст.

Дальше всех в этом деле продвинулась компания Google, т.к. имеет достаточно средств для инвестиций. Эта компания, кроме прочего, создала самый большой онлайн-словарь, который помогает распознавать голос и переводить его в графическую версию.

Смотрите подробное руководство в этом ролике:

  1. Когда вы произносите речь, в комнате должно быть тихо. Звуки природы, музыка, плач ребенка воспринимаются системой, как шум. Из-за этого текст будет набран с большими ошибками.
  2. Не говорите, если что-то едите. Это не только скажется на качестве набора, но и опасно для жизни к тому же.
  3. Перед началом работы нужно подобрать правильную громкость вашего голоса, а также понять какая чувствительность у вашего микрофона.

    Для этого попробуйте записать несколько предложений привычным тоном. Если в записи будут перебои, обратитесь к настройкам микрофона.

  4. Делайте небольшие паузы между словами.
  5. Избегайте длинных фраз.

Кто-то скажет, что программа для голосового набора – это прекрасный помощник, который освободил им руки и облегчил жизнь в целом. Другие решат, что «овчинка выделки не стоит». Потому выбрать, стоить ли их использовать, вам предстоит самостоятельно.

А уж из каких сервисов выбирать, вы уже знаете…

Приветствую вас, уважаемые читатели блога сайт! Давно собирался подготовить заметку о программах и онлайн сервисах, при помощи которых можно переводить свой голос прямо в текст. Как рассказчик (мне кажется), я неплохой, но вот излагать свои мысли в виде печатного текста мне дается с большим усилием. Вот я и задался целью найти «чудо-сервис», который смог бы мою речь преобразовать в текст.

Актуальность набора текста голосом на сегодняшний день очевидна. Ведь не зря разработчики Google «вкрутили» в свой браузер Google Chrome голосовой поиск. И уже на основе этого открытого кода некоторые программисты и Web мастера сделали разные блокноты и сервисы для преобразования речи в текст в онлайн режиме. Для многих пользователей и особенно пользователей с ограниченными возможностями это просто незаменимые сервисы.

Попробовав в работе один из сервисов, которые я приведу ниже, возможно, не каждый получит желаемый результат. Особенно те, кто постоянно набирают тексты на компьютере, и для кого с текстами является основным источником дохода. И многие хотели бы как-то облегчить этот нелегкий труд. Но, если немного потренироваться, перевод голоса в текст в этих онлайн сервисах может получаться вполне качественный.

Чтобы приступить к преобразованию голоса в текст, понадобится микрофон (в ноутбуках он встроенный), желательно хорошая скорость интернет соединения и браузер Google Chrome не ниже 25 версии. В других браузерах функция голосового набора текстов, к сожалению, не работает. Как я уже говорил, код голосового распознавания в текст от разработчиков Google является открытым, и его можно использовать на своем сайте. Вот и я немного его русифицировал и установил на свой блог.

Голосовой ввод текста с помощью Web Speech API

Запустите страницу для ввода текста голосом в браузере Chrome. Внизу окна выберите язык, на котором вы планируете диктовать текст. Нажмите на иконку микрофона в верхнем правом углу. И в всплывшей строке нажмите кнопку «разрешить» использование браузером микрофона.

Теперь вы можете неспеша и четко наговаривать недлинные фразы. После завершения надиктовки текста голосом его можно выделить и при помощи комбинации клавиш на клавиатуре Ctrl+C скопировать в буфер обмена, а затем вставить в любой редактор для обработки. При желании текст можно сразу отправить по электронной почте.

Пожалуй, Web Speech API – самый простой и довольно качественный способ преобразовать свою речь в текст. Так как не надо отвлекаться на какие-то дополнительные манипуляции с клавиатурой. Просто включил микрофон и говори текст. В любом случае придется использовать какой-нибудь дополнительный текстовый редактор для дальнейшей корректировки надиктованного текста.

Преобразование речи в текст на странице сайта Online Dictation

Простой «буржуйский» блокнот, расположенный на странице Dictation , имеет всего три кнопки. Включить микрофон для записи, очисть поле для ввода текста и экспортировать надиктованный текст на свой компьютер, Google Диск, хранилище Dropbox или отправить электронной почтой в текстовом формате TXT. Все очень просто. Пробуйте, тестируйте и наслаждайтесь полученным результатом.

Набор текста голосом - онлайн сервис Talk Typer

Этот «буржуйский» онлайн блокнот распознавания голоса имеет несколько дополнительных встроенных функций. Возможность заменять продиктованные слова на другие предложенные варианты. Вставлять знаки пунктуации. Прослушать надиктованный текст, нажав на иконку динамик. Сделать перевод на выбранный иностранный язык. При желании можно изменить отображение внешнего вида и размер шрифта, нажав на иконку «шестеренка». Единственное неудобство: после каждой произнесенной фразы ее надо сбрасывать в нижнюю часть блокнота, нажимая на стрелку, и затем снова включать микрофон. В целом, это полноценный сервис, в котором можно преобразовать речь в текст и отредактировать его по своему усмотрению. Готовый текст можно распечатать, Твитнуть или отправить на электронную почту.

Распознавание голоса в блокноте VoiceNote

Этот сервис распознавание голоса в текст можно установить как приложение в браузер Chrome, или просто добавить в закладки сайт , который находится . Войснот по функционалу практически ничем не отличается от предыдущего сервиса-блокнота распознавания речи Talk Typer. Такой же основной минус, после каждой произнесенной фразы надо снова включать микрофон. Но зато не надо перемещать надиктованный текст, как в Talk Typer. Простой и очень удобный интерфейс сервиса для преобразования текста. Думаю, что он многим придется по душе. Тестируйте и делайте выводы.



Статьи по теме