Calender

S M T W T F S
   1234
567891011
12131415161718
19202122232425
262728293031 
<< May 2019 >>

Categories

Archives

Recent Entries

Recent Comment

Recent Trackback

パソコン&ネット

MSの音声認識技術

 Microsoftというのは、本当に本家商売の企業ですからね。元祖としてどこかが出したヒット商品を真似て、それを小道に改良して元祖よりもそこそこ使えるものに仕上げて本家として売りだす。今のMicrosoftにとっては仮想敵はGoogleであって、Yahoo!を買収しようとしてみたり、検索事業に参入したりと、完全に後追いです。音声認識技術も、Googleの音声検索が細切れの単語なのに驚くべき認識精度を誇るため、後を追いかけたというところでしょうか。研究は前からやっていたのでしょうが、それほど重要視はしていなかったはず。

【MSの音声認識技術--言葉の「意味」の理解に向けた新たな取り組み】CNET

 Microsoftは、自社の音声プラットフォームをもう少し決定的なものにしたいと考えている。

 Microsoftの音声技術は長年にわたって、人が何を話しているのかを理解する能力を高め、同時に、音声による検索やコマンドを携帯電話以外のデバイスでも行えるようにしてきた。しかし、同じくらい重要な要素が欠けていた。それは、言葉の意味やその背後にある文脈をより深く理解することだ。

 そのためにMicrosoftは、「会話理解(Conversational Understanding:CU)」と呼ばれる技術の構築に取り組んでいる。CUは、音声、辞書、文法構造、機械学習を組み合わせて、ユーザーが話していることをよりよく理解し、システムが意味や文脈をすべて考慮した答えを出せるようにしようというものだ。
 音声認識は難しいですね。アドバンスト・メディアのAmiVoiceの場合は、音声の解析と同時に、文脈で単語を判断しているようで、リアルタイムで変換していた単語と確定した単語がずいぶん違います(もちろん確定した単語のほうが高い精度ですが)。アクセントがはっきりした欧米の言語に比較して、日本語は抑揚が少なく、また方言差が大きいですからね。ただ、音声認識技術を10年近く追いかけてきた見とすると、もう充分に実用レベルに達していると思います。後は、Googleとかが自社OSにキーボード入力に替わる手段として、デフォルトで搭載するかどうか。

Microsoftも、キーボードアレルギーのユーザーを取り込み、iPadのようなわかりやすさに対抗するためには、自社独自の技術が必要と気づいたことでしょうし。Twitterとか、TweetMeなどを使っていると本当につぶやく感覚ですから。携帯電話が普及する当初は、車内マナーとかでトラブルもありましたが、こういうつぶやき自体はそのうちに日常の風景になるでしょうから。口にだすのが恥ずかしい単語・他人に聞かれてまずい機密情報以外は、音声入力での入力が、ごく当たり前になるような。
  • 2010.12.21 Tuesday
  • 09:00

-

スポンサーサイト

  • 2019.05.25 Saturday
  • 09:00
  • -
  • -
  • by スポンサードリンク

Comment
Send Comment








   
この記事のトラックバックURL
Trackback