FC2ブログ

鈴の音情報局blog

携帯関連の将来や最新の技術情報や業界の行く末などを適当に綴るblogです。 内容の信憑性は?余り信じない方がいいと思います。
本家の鈴の音情報局はこちら→http://suzusuzu.dip.jp:8800/
スマホ・携帯端末アクセス[ランキング][アクセスシェア(グラフ)] (毎年10/1にログをクリア)

圧倒的な差が有るのか?Siri vs しゃべってコンシェル

声でスマホを使う時代が本格到来 -- iPhone の「Siri」とドコモの「しゃべってコンシェル」を比較

音声アシスタンスのSiriですがこれは便利といってはまっている人が意外といた。
まだ英語での対応しかない状態で、一部の日本人が使っていたぐらいの声しか聞こえて来なかった。

対抗サービスがGoogleから開発中との記事が見られていましたが、実際にAndroid
向けのトップでサービスインしたのはドコモだった。

ドコモがこれからTVで流すCMがYoutubeで先行公開された。
とりあえず見て欲しい。

「しゃべってコンシェル」コマーシャル映像 その1 ~ NTTドコモ

便利さを一通り宣伝した後の最後のトドメ。
女の子が「私のことを好き?」と聞いた回答の「大好きです」に反応する「わ~、大好きだって~」
という喜びの言葉、多分これがこのCMの肝のように思った。

それが無くても感動的に便利な様子が次々に映し出されている。
機能として今考えうるほぼ完璧に近い所まで練り上げている。
くだらない質問にもそれなりにちゃんと答えてくれる。
昔の人口無能に良くある「理解できません」という回答をほぼ見る事が無い。


音声アシスタンスはSiriがiOS5.1で日本でも先行した。
ドコモが二番手で追いかける事になったが日本でのサービス開始時期は1~2ヶ月違いと
ほとんど差がない状態だ。しかしサービスの内容と質が圧倒的に違うなと思った。

それを感じさせてくれるのが冒頭にリンクした記事。

そこに有るSiriとしゃべコンの反応の違いで一目瞭然だ。

■ 基本編「東京駅に行きたい」
1)「今日の予定は?」
-- Siri:今日はあと1件予定があります。(予定を表示)
-- しゃべってコンシェル(以下コンシェル):今日の予定をお出しします。(予定表を表示)

2)「東京駅に行きたい」
-- Siri:すみませんが、私には「東京駅に行きたい」が理解できません。
-- コンシェル:ここの最寄駅から「東京」の乗換えをお調べします。(最寄り駅から東京駅までの地図を表示)

3)「ニュースが見たい」
-- Siri:申し訳ありません。「ニュースが見たい」が理解できません。
-- コンシェル:ニュース検索を起動します。何をお調べしますか?(最新ニュース一覧を表示)

4)「メモしたい」
-- Siri:わかりました。メモをとります。内容を教えてください。
-- コンシェル:メモ画面を開きます。作成するメモの内容をお話ください。

5)「カメラを起動して」
-- Siri:そうして差し上げたいところなのですが、許されていないのです。申し訳ありません。
-- コンシェル:カメラ機能を表示いたします。(カメラ、ビデオ、バーコードの選択画面を表示)

■ 応用編「近くの喫茶店を探して」
1)「カツオのレシピが知りたい」
-- Siri:私には理解できません。
-- コンシェル:Cookpad で「カツオ」のレシピをお調べいたします。(検索結果を表示)

2)「近くの喫茶店を探して」
-- Siri:よろしければ、”喫茶店”をWebで検索しますよ。
-- コンシェル:エリアガイドで付近の「喫茶店」をお調べします。(エリアガイドの結果を表示)

3)「野球ゲームがやりたい」
-- Siri:”野球ゲームがやりたい”をWebで検索してはいかがでしょう?
-- コンシェル:ゲーム検索で「野球」をお調べします。(検索結果を表示)

4)「カメラに関する本が欲しい」
-- Siri:お店や会社、地図、渋滞情報を検索できるのは、米国内でアメリカ英語を使っているときだけです。申し訳ありません。
-- コンシェル:本・コミック検索で「カメラ」をお調べします。(検索結果を表示)



この9つのテストでしゃべコンは完璧な反応を返している。
片やSiri日本語版はメモ等の一部は動きましたが殆どの機能が理解できないか未対応か、
ウェブ検索にたらい回しして逃げているだけという結果になった。
私が実際に使って試したわけではないが、この記事の結果と公表されている情報からカタログ的な
判断をするとSiriの日本語版と英語版の両方に対してドコモのしゃコンは
圧倒的に上回った反応を示すと考えられます。

真剣に使い込めばしゃべコンも確かに穴が有ると思われますが、実際使ってみた
反応や動画の状況を見てもあいまい時な質問に対する処理が非常に上手い。

一方Siriは理解出来ても都合が悪いとすぐにウェブ検索に逃げてしまう。
それではGoogle検索のなっ♪か♪め♪ぐ♪ろ♪あ~♪と♪ぎゃ♪ら♪り~♪と大して変わらない事しか
出来ない事になる。むしろ割り切って使える分なっ♪か♪め♪ぐ♪ろ♪あ~♪と♪ぎゃ♪ら♪り~♪の方が
まだストレスが溜らない。


勿論しゃべコンは対応が日本語だけでいいという強みが有る。
しかし実はこの辺りの自然語の曖昧処理は日本の各メーカーが非常に高い技術力を持っている分野です。
恐らく海外で同レベルで対抗できる所はそう多くはないと思います。

音声解析や画像解析による音声ファイルや動画ファイルからの検索等、NECや富士通を始め
日本のメーカーは20年以上も前から研究を続けてきました。

また家電の世界では一時期「ファジー理論」なんて妙なものも流行りましたがあれも
曖昧処理が製品として出たものの一端です。


ドコモからすると携帯端末上のコンシェルジュサービスはかなり以前から行っていたものだし、
更に音声による自然語解析という大得意な企業を多く抱えている分野にわざわざアップルの側から
来てくれたわけで、相当自信を持って受けて立っていると思われます。

今後ドコモはしゃべコンをiコンシェルと融合させて一つにしていくのではないかなというのが
私の見方です。しゃべコンはあくまでカウンターで待っているホテルのコンシェルジュサービスレベル
のものです。iコンシェルは自分の為に能動的に端末側から情報を知らせてくれるサービスです。
これが癒合したらどれだけ便利になるかは想像に難くないでしょう。

しかも元からプッシュ型のコンシェルジュサービスを開始しているのはドコモだけです。
様々な運営のノウハウを含んで他が追従しようとしてもスタート位置からして既に差がついています。
珍しくドコモが先行出来ている分野だなと思います。

それと音声入力による自然語解析がこれだけ得意なのですし、当然英語環境も開発をしている
と思われますのでこれで世界に出て行って欲しいなと思います。ドコモがこれをGoogleに
先んじてサービスイン出来るのも長年の開発や蓄積が有ってこそです。

今からはじめてもGoogleよりもいいものを同時期に出せそうに思うのですけどね。
英語圏ぐらいなら結構圧倒出来そうな気もしなくはないです。
国ごとのカスタマイズは様々に有るでしょうが。
単体のアプリ商品としても成立するかもですね。


私が思うにアップルはiOSとSiriの両方を開発出来る立場なのにOSと音声アシスタンスの
融合というレベルでAndroid端末に圧倒的に負けてしまっているのは情けないと思います。

今の所Siriは、特に日本語版の出来はまだまだ貧弱ですが、次のバージョンでどれだけ
良くなるのか見ものですね。しぇべコンという明確な目標が出来たのですからこの辺り
どれだけ追いつけるのかが一つの試金石かなと思われます。
関連記事
  1. 2012/03/16(金) 19:45:23|
  2. 携帯
  3. | トラックバック:0
  4. | コメント:13
<<アウトローな中華タブレット「E人E本」 | ホーム | 次回iPhoneは4G LTE対応か、ベライゾン・ワイヤレスが示唆>>

コメント

しゃべってコンシェルの、音声認識エンジンは、(株)国際電気通信基礎技術研究所で開発された技術が使われているようです。
一応、株式会社ですが第3セクターですので、国家プロジェクトみたいなものです。
同じ技術を利用した音声認識エンジンは、結構前(2007年頃)から使われているようです。
又、英語・中国語は翻訳システムも有るようなので、少なくとも英語についてもSiriより優れている可能性はあります。
Siriにとっては、相手が悪かったという感じですね。
  1. URL |
  2. 2012/03/16(金) 21:23:29 |
  3. YASU #eAb5nx9M
  4. [ 編集]

他にも日本の技術の凄さがこんな製品として結実しました?

Androidで米を炊く! スマホタッチで炊飯設定ができる炊飯ジャー発売へ
http://www.tabroid.jp/news/2012/03/androidrice.html

…ごめんなさい、あまり便利そうに思えないです(苦笑
  1. URL |
  2. 2012/03/16(金) 22:07:08 |
  3. みっく #-
  4. [ 編集]

僕は、P-02Dで使ってみました。
はっきり言ってクソですw
実際に使ってみて下さい。
「新千歳空港に行きたい」
と話すと、
「恥ずかしい」
と返されました。
10回話しかけて、1・2回、まともに返ってきたら良い方ですよw
  1. URL |
  2. 2012/03/16(金) 23:42:05 |
  3. モロリン #-
  4. [ 編集]

「鈴の音情報局で検索」
と話しかけると、きっちり認識し、
「私も同じことを考えてました」
と返してくれましたが、検索はしてくれませんでしたw
笑いましたw

ドコモ しゃべってコンシェル
  1. URL |
  2. 2012/03/16(金) 23:46:56 |
  3. モロリン #-
  4. [ 編集]

日本語入力に例えるとIMEとATOKみたいな感じでしょうか?ただアップデートで大幅改善してきそうな予感が。
  1. URL |
  2. 2012/03/17(土) 01:58:37 |
  3. IRN58 #Qi8cNrCA
  4. [ 編集]

新千歳空港、一発でいきましたよ!
はっきり喋ってらっしゃいますか?
  1. URL |
  2. 2012/03/17(土) 02:07:03 |
  3. ぞぞ #-
  4. [ 編集]

>YASUさん
マジですか。
しゃべってコンシェルって半分は国策絡みだったんですね。
てっきり音声解析に力を入れていたNEC辺りのエンジンを使っているとばかり思っていました。
自分でも使ってみて文脈解析のパーサーもかなりしっかりしている印象ですから
日本語よりもかなり解析が楽な英語版では間違いなくSiriは越えると思います。
いきなり3大難語の一角をきっちりと乗り切りましたしね。
日本の技術は捨てたものではないなと思いました。

>みっくさん
米研ぎまでスマホがしてくれると完璧なんですけどね。
炊飯器だけの設定よりも便利さが有るとすれば、つやつや炊きを○○時に
炊きたいとか複数項目に渡った設定をスマホ側でプリセットしておいて
それを瞬時に設定できるって事でしょうか。
自分でご飯を炊いているのでその辺便利な使い方はなんとなく想像がつきます。
でも特に冬場は米研ぎをしてくれるのが一番有り難いですww

>モロリンさん
まずはちゃんとした活舌の練習をした方がいいかも知れませんよ。(笑)
私はかなりの確率で認識しましたから。
ただしモロリンさんがこのブログを検索できなかったのは思わぬ穴を発見したといえます。
ホームページ等の検索系はどうやら弱そうです。
どうしてもdmenuやクックパッドに飛ばそうとしたがるので通常の検索が
通り難い事をテストで発見しました。
それ以外の普通の人が普通に使う様子を想像すればテストでも便利さが傍受できますよ。



私が使った実績集の一部

「何か食べたい」
→「○○のグルメ情報をお調べします」
→周辺情報で居た場所の近所の食べ物屋がグルメ情報で検索された(519件ヒット)

「明日8時半に起きたい」
→「2012年3月18日8時30分にアラームをセットします」
→確実に認識して動作したが標準アラームアプリにセットしに行くようなので
→私が使っている「目覚まし時計Xtreme無償版」にはセットされなかった。
→これはしゃべコンに限らず音声アシスタンス共通の問題になりそう。
→共通インターフェイスが必要になりそうです。

「今のニュースを知りたい」
→「『今』関連のニュースをニュースをお調べます」
→dmenu内の最新のニュースが表示された。

「相撲の結果が知りたい」
→「『相撲 結果』関連のニュースをニュースをお調べます」
→正しく検索されたがdmenuのニュースに相撲の結果は無かった。

「チーズケーキの焼き方を知りたい」
→「クックパッドで『チーズケーキ 焼き』のレシピをお調べします」
→焼きチーズケーキのレシピが1880件ヒットした。

「新千歳空港に行きたい」
→「ここの最寄り駅から『新千歳空港』の乗換えをお調べします」
→最寄り駅から電車で関西空港まで連れて行かれ、
→関西0700発→新千歳0850着の飛行機に乗る案内をされました。


私の低い目の篭った声でもほぼ100発百中認識できたので、鼻づまりとか
意識的に認識しにくい話し方をしない限りはかなり認識が出来そうに思います。
ちょっと意地悪をして雑音を入れ気味にしゃべっても認識できたので
音声エンジンは相当いい出来をいていると思います。

他にも色々試しましたが本当に感動的な性能ですね。
  1. URL |
  2. 2012/03/17(土) 02:54:29 |
  3. 鈴 #GpEwlVdw
  4. [ 編集]

>IRN58さん
確かにそんな感じかもですね。ただ(本来の意味の)IME[Input Method Editor]ではなく
単なるアプリレベルなんで形は違いますけどね。
音声解析エンジンは既に5年の熟成が済んでいるものみたいですし、パーサー(文意解析)も
ドコモはリアルタイム翻訳の研究もしている位ですから相当な技術を持っていると思われます。
ちょっとやそっとではひっくり返せる差じゃないなと私は思いますが、Siriがアプリの起動基準を
もっと緩めれば多少追いつくかなとも思えます。

>ぞぞさん
ですよね、私も一発認識で表示されました。



おまけ

「友達の作り方」
→「クックパッドで『友達』のレシピ情報を表示します」
→(ー_ー;)
  1. URL |
  2. 2012/03/17(土) 03:03:16 |
  3. 鈴 #GpEwlVdw
  4. [ 編集]

実際に体験してきましたが流石ですね。siriも驚きましたが認識と答え全てにおいてdocomoの圧勝でした。
siriの聞き取りは素晴らしいですが
分かりません。を連発するのが残念でした。
音声も機械的で微妙な感じに笑
この分野ではdocomoがズバ抜けていますね。
日本語に限ってはAppleの負けですね。
  1. URL |
  2. 2012/03/17(土) 05:31:46 |
  3. 猫背 #-
  4. [ 編集]

とりあえず喋ってコンシェルって名前以外は良さげですね
  1. URL |
  2. 2012/03/17(土) 11:04:09 |
  3. K #-
  4. [ 編集]

ごく一部の反応ですが

先日は記事の修正、ありがとうございました。

この2つのサービス、実用的なのはやっぱり「しゃべってコンシェル」の方なんでしょうかね。

ただまあ、某ちゃんねる方面ではわざと変な質問して、
その返しを見て、「siriたんかわいい」とか盛り上がってたぽいですねw

擬人化したがるのは日本人的な楽しみ方と言えそうですけど、
こういうのは音声認識エンジンと言うよりは、データベースの作り方も
違いがあるのかなと思いました。


コンシェルの方にも、そういう遊び心みたいなのって、あるのかなー
・・・どんだけ需要あるかは、わかりませんけど。
  1. URL |
  2. 2012/03/17(土) 11:51:05 |
  3. TK #-
  4. [ 編集]

明石家さんまの声が、声で操作できる家電に通用しなかった、という話をTVで見た記憶があります。認識度合いに個人差がかなりあるのかもしれません。
(さんまは話を盛るので、話自体の信憑性もかなり怪しいですが。)
  1. URL |
  2. 2012/03/17(土) 15:14:37 |
  3. 壱 #-
  4. [ 編集]

「Siri」と「しゃべってコンシェル」に埋もれてて全然目立っていませんが、
「どうしたの?」に私は注目しています。色々と比較中です。
http://doushitanon.blogspot.jp/

鈴の音情報局さんはしっかり分析がしてあったので、思わず書き込んでしまいました。
競合サービスがあって、それぞれ成長しそうなので楽しみですね。
  1. URL |
  2. 2012/03/18(日) 02:38:47 |
  3. doushitanon #-
  4. [ 編集]

コメントの投稿(投稿時には必ず何らかの名前を付けてください)


管理者にだけ表示を許可する

(名前を入れないとクリックできません)

トラックバック

トラックバックURLはこちら
http://suzunonejh.blog15.fc2.com/tb.php/2351-8d96a640
この記事にトラックバックする(FC2ブログユーザー)

最近の記事

機能リンク

最近のコメント

カテゴリー

ブログ内検索

ブログリンク

RSSフィード

QRコード

QR

月別アーカイブ



メールフォーム

お問い合わせ・ご質問はこちらから。

名前:
メール:
件名:
本文:

suzunone.m(あっと)gmail.com に
直メでもOKです。