★土岐正造とその仲間が雑多な興味の対象について、好き勝手に書き散らすBlogです。
 
<< NTTデータがiPad導入 | main | IntelとMSの対iPad戦略 >>
MSの音声認識技術
0
     Microsoftというのは、本当に本家商売の企業ですからね。元祖としてどこかが出したヒット商品を真似て、それを小道に改良して元祖よりもそこそこ使えるものに仕上げて本家として売りだす。今のMicrosoftにとっては仮想敵はGoogleであって、Yahoo!を買収しようとしてみたり、検索事業に参入したりと、完全に後追いです。音声認識技術も、Googleの音声検索が細切れの単語なのに驚くべき認識精度を誇るため、後を追いかけたというところでしょうか。研究は前からやっていたのでしょうが、それほど重要視はしていなかったはず。

    【MSの音声認識技術--言葉の「意味」の理解に向けた新たな取り組み】CNET

     Microsoftは、自社の音声プラットフォームをもう少し決定的なものにしたいと考えている。

     Microsoftの音声技術は長年にわたって、人が何を話しているのかを理解する能力を高め、同時に、音声による検索やコマンドを携帯電話以外のデバイスでも行えるようにしてきた。しかし、同じくらい重要な要素が欠けていた。それは、言葉の意味やその背後にある文脈をより深く理解することだ。

     そのためにMicrosoftは、「会話理解(Conversational Understanding:CU)」と呼ばれる技術の構築に取り組んでいる。CUは、音声、辞書、文法構造、機械学習を組み合わせて、ユーザーが話していることをよりよく理解し、システムが意味や文脈をすべて考慮した答えを出せるようにしようというものだ。
     音声認識は難しいですね。アドバンスト・メディアのAmiVoiceの場合は、音声の解析と同時に、文脈で単語を判断しているようで、リアルタイムで変換していた単語と確定した単語がずいぶん違います(もちろん確定した単語のほうが高い精度ですが)。アクセントがはっきりした欧米の言語に比較して、日本語は抑揚が少なく、また方言差が大きいですからね。ただ、音声認識技術を10年近く追いかけてきた見とすると、もう充分に実用レベルに達していると思います。後は、Googleとかが自社OSにキーボード入力に替わる手段として、デフォルトで搭載するかどうか。

    Microsoftも、キーボードアレルギーのユーザーを取り込み、iPadのようなわかりやすさに対抗するためには、自社独自の技術が必要と気づいたことでしょうし。Twitterとか、TweetMeなどを使っていると本当につぶやく感覚ですから。携帯電話が普及する当初は、車内マナーとかでトラブルもありましたが、こういうつぶやき自体はそのうちに日常の風景になるでしょうから。口にだすのが恥ずかしい単語・他人に聞かれてまずい機密情報以外は、音声入力での入力が、ごく当たり前になるような。
    【2010.12.21 Tuesday 09:00】 author : 土岐正造
    | パソコン&ネット | comments(0) | trackbacks(0) |
    スポンサーサイト
    0
      【2018.08.18 Saturday 09:00】 author : スポンサードリンク
      | - | - | - |
      この記事に関するコメント
      コメントする









      この記事のトラックバックURL
      http://bunzaemon.jugem.jp/trackback/12448
      トラックバック
      Amazonプライム Amazonプライム会員なら、人気の映画やTV番組が年会費3900円(税込)で見放題! Amazonプライム