【不眠症カフェ】　Insomnia Cafe

< 新しい記事

新着記事一覧(全9075件)

過去の記事 >

2017.12.25

記事　｢ＡＩスピーカー｣　３社を比較

カテゴリ： E 【情報機器・家電・TV・ブルーレイ】

AIスピーカーに興味がある
RV CM で、まるでSFのロボットの様に
便利で忠実な部下のような存在に思えるが
今すぐにでも買って､試してみたい
ただ、こういう製品は､データが蓄積されるほど
進化するはずで買い時が難しい

しかし
私自身としては
ATOKの音声入力を使う方が先にやるべき事かも知れない（笑）
家内は､とっくに､スマホで､音声入力でメールを打っている
私は､遅れている（笑）

　　ーーー　記事　ーーー

＜ＡＩスピーカー＞暮らしを便利にする？　
３社を比べてみた

12/24(日) 10:00配信
毎日新聞

＜ＡＩスピーカー＞暮らしを便利にする？　３社を比べてみた

左からグーグルホーム、クローバウェーブ、アマゾンエコー＝各社提供

　米国で２０１４年から販売され、人工知能（ＡＩ）を活用する「スマートスピーカー」が今秋、グーグル、ＬＩＮＥ、アマゾンから国内で発売された。音声で操作して天気予報などの情報が得られるが、ＡＩがさらに賢くなるには今後、多くの人が使って家庭内の会話情報を集める必要があるという。プライバシーの懸念もある中、日常生活を便利にする新たなサービスの開発につながるのか、主要３社のスピーカーを使ってみた。【岡礼子】

　◇怒ったら「ごめんなさい、静かにします」

　「もう一度、お願いします」「ゆっくり、はっきり話してください」－－。イギリスで約７年前に放映されたコメディ「Ｖｏｉｃｅ　Ａｃｔｉｖａｔｅｄ　Ｅｌｅｖａｔｏｒ（音声認識エレベーター）」をご存じだろうか。男性２人が、エレベーターに１１階を指示するが、スコットランド英語のため、何度言っても認識されない。２人は怒り出し、悪態をつくが、エレベーターが返すのは決まった言葉だけだ。

　このエレベーターの仕組みは分からないが、現在のスマートスピーカーは各社がそれぞれ開発したＡＩを活用し、音声として聞き取った質問や指示を文章に変換して解析した上で、専用データベースを検索したり、連携するサービスにつなげたりして答えを返している。ＡＩはクラウド上にあるのでインターネットがないと使えない。ＬＩＮＥクローバ開発室の橋本泰一さんは「ノイズと人の声を判別することが重要で難しい。人の声だと分かれば、言葉にあてはめることができる程度にはデータが集まっている」と話す。

　◇指示の前には決まった言葉

　「対話型」と言われるものの、話しかける前は、決まった言葉で呼びかけるのが基本型だ。呼びかけの言葉は「ねえ、グーグル」「アレクサ」（アマゾン）「クローバ」（ＬＩＮＥ）とそれぞれ異なっている。音声認識を始めるスイッチのようなもので、指示の前に言わなければならない。

　呼びかけなくても「会話」ができるのは、ＡＩから質問されて答える時だ。例えば、アレクサに商品名を聞くと、説明した後に「もっと聞きたいですか」「購入しますか」と問い返されることがある。その時は、呼びかけの言葉なしで「はい」「いいえ」と答えれば認識する。クローバは、あいさつに続けて「調子はどう？」のように、指示以外の内容を話しかけると、連続会話モードになり、しばらく「おしゃべり」は続けることができる。

　指示がうまく伝わらず、何度言っても「わかりません」と言われたり、誤った結果が返ってきて悪態をつきたくなったりした時も呼びかけの言葉がいる。ＬＩＮＥのスマートスピーカーに「クローバ、うるさい」と怒ったら、「ごめんなさい、静かにします」と返ってきた。

　◇できることは各社で違う

　ＡＩはどのような仕組みで人の質問に答えているのだろうか。名詞や動詞などを聞き取って（１）言葉の意味を言う（２）音楽を流す（３）天気予報やニュースを読み上げる（４）近くの飲食店を紹介する－－といった回答をするのは、各社でほぼ共通している。

　一方で、質問によって対応が異なるケースも。例えば「次の夏季五輪はいつ？」と尋ねると、グーグルは検索でトップに表示される「２０２０年の東京オリンピックは７月２４日金曜日から……」を読み上げるのに対し、アマゾンは「すみません、わかりません」。ＬＩＮＥは「あなたの良い日にされてはいかがでしょうか」と、答えは異なる。

　グーグルのＡＩは主に「ネット検索」を使っており、検索結果から適切と思われる答えを絞れない場合は「わかりません」という回答になるという。「音楽を聴かせて」など、検索ではできない回答が求められた時は連携するサービスにつなげる。現時点での連携サービスは少ないが、検索でわかる乗り換え案内などは答えられる。

　一方、アマゾンは、連携サービスが国内約１００社と多く、設定したサービスを音声で呼び出して使うイメージだ。乗り換え案内などのほか、タクシーを呼ぶ、弁当の予約をするといった現実のサービスも使える。当然ながら自社のネット通販につながりやすく、事前に許可してあれば音声で購入でき、配送状況を確認することができる。

　ＬＩＮＥは、言葉の説明には現在、ウィキペディアを使っている。まだ連携サービスがなくできることは少ないが、「地球のどこかということにしてください」「自分で言うのは恥ずかしいですね」など、答えられない時の文言の種類は多い。コミュニケーションを重視しており、いつも同じにならないように設定しているほか、ＬＩＮＥブログなど自社サービスを通じて蓄積されたデータを音声認識に生かしており、口語体が得意という。８日に発売した小型版では、ＬＩＮＥ無料通話をかけられる機能もつけた。

　◇いつも「聞いている？」

　スマートスピーカーは、家庭内の音声を集めてしまいプライバシーが漏えいするリスクがあるのではないかとの懸念がある。どこまで「聞いている」のだろうか。

　各社とも、呼びかけの言葉をきっかけに認識が始まるとしている。声が途切れるか、一定時間がたつと認識は終わる。マイクを切ることができるほか、認識している間は本体のライトがつき、「聞いている」とわかる。また、グーグルとアマゾンはアプリで履歴を確認し、削除もできる。履歴には音声も録音されている。ＬＩＮＥは現在、履歴を確認する機能はない。

　使ってみた限り、アマゾンとグーグルは少々言葉に詰まったくらいでもライトが消え、認識しなくなる。これに対してＬＩＮＥは他２社に比べると長めだ。同社によると「ＬＩＮＥを送る機能があるので、あえて長くしている。日々調整しているので、時間は言えない」。

　◇毎朝の動作を一言で　鍵は注意

　便利に感じたのは、複数の操作をまとめることができる点だ。グーグルとアマゾンのスピーカーにある機能で、「アレクサ、リビング、オン」などと言えば照明やテレビ、エアコンのスイッチが入り、「ねえ、グーグル。おはよう」の一言で、天気予報とニュース、今日の予定を読み上げるといった設定もできる。

　スマートスピーカーに対応した家電製品はまだ少ないが、テレビやエアコンなど赤外線リモコンで操作する製品は、別製品のコントロール機器と無線ＬＡＮ（Ｗｉ－Ｆｉ）を使えばスマホのアプリから操作できる。コントロール機器は家電製品より安価で、スマートスピーカーに対応した複数の製品の販売が始まっている。ＬＩＮＥは、赤外線リモコンを登録する機能がスピーカー専用アプリにあるので、家電を買い替えなくても音声で「照明を消して」といった使い方は可能だ。

　ただ、セキュリティーに注意する必要はある。スマートスピーカーもコントロール機器もＷｉ－Ｆｉを使うため、安全性の高いＷｉ－Ｆｉを利用し、ルーターをセキュリティーソフトなどで守ることが必要になる。家電のオンオフや玄関の鍵の開閉など、スマホでできることは、家の外から遠隔操作される懸念がある。

　◇次はカメラによる「非言語情報」か

　スマートスピーカーは、生活を便利にしてくれるのだろうか。国立情報学研究所の佐藤一郎教授（工学）は「ＡＩと人間が連続した会話ができるようになる日は、思ったより近いかもしれない」と話す。従来、人と「会話」する機械を作るためには、朗読した音声と対になる文章のデータを集めていた。しかし、ＡＩエージェントの登場で会話データを収集できるようになり、急激に精度が上がってきたという。スマートスピーカーを使う人が増えれば「会話」の内容も多彩になり、精度はさらに向上するとみられる。

　一方で、佐藤教授は「本当にブレークするのは、カメラと音声を組み合わせて、人間の行動をデータ化できた時ではないか」とも指摘する。ＡＩがうまく機能するにはデータの量と質がカギになるが、人間の行動には言葉に表されない部分が膨大にあるので、ＡＩが人間の状況を把握してサポートするにはこうした非言語情報も重要という。ただカメラで行動を記録されることは、スピーカー以上に抵抗感を覚える人がいるだろう。佐藤教授は「１００人に１０人程度が協力すれば必要なデータは集まるのではないか 。（音声だけの）スマートスピーカーはファーストステップに過ぎない」と話している。

お気に入りの記事を「いいね！」で応援しよう