ラベル html speech input api の投稿を表示しています。 すべての投稿を表示
ラベル html speech input api の投稿を表示しています。 すべての投稿を表示

Google Multilingual Voice Search via SEJ(Chrome ver11以上のみ)

今年3月にChromeへ追加されたHTML speech imput APIを使うことで音声からテキストへ変換することが可能となりました。

それを利用してSEJよりGoogle Multilingual Voice Searchの紹介がありましたので、ご紹介いたします。

もちろん日本語もOK。

検索ボックスの右側にあるマイクのマークをクリックすると、「お話しください」と出ますので、しゃべるだけ。


「渋谷」の検索結果です。


スマートフォンでの技術が次々と生かされているという印象です。
ただ、音声入力技術が今後どんな方向へ進むのかが、なかなかイメージ出来ずにいます。職場でブツブツ言うわけにもいかず、マイクロソフトのWordも音声入力を昔から備えていましたが、結局それを利用している人は非常に少ないと思います。精度の問題だったのかもしれませんが。

一つには自宅で何かの雑誌、本等でメモをしておきたい部分を音読するだけでテキスト化するという方法があるでしょう。インタビューの場合は、相手と自分の声をそのままテキスト化すれば編集も楽になるかもしれないので、ボイスレコーダーの代わりにマイクを置いておくという利用方法も出来るかもしれません。ただし、どちらの発言かという点で弱いので、インタビュー前に発言者が何名であるかを事前に登録し、人を分けてくれると良いですね。

改行に関しては時間的な間を取るしか無いかもしれません。何かの記事でちらっと見ただけですが、「改行」という言葉を2回言うと、機能としての「改行」になるなどの動作があると多少は使える物になるのかもしれません。

どちらにしても、PCではメインの機能というよりサポート的な機能のような気もします。スマートフォンではメインの機能として利用される事も多いでしょう。