広告
posted by fanblog
2018年06月05日
グーグルの会話型AIが、人間そっくりに会話する!
米グーグルの会話型AI(人工知能)は、最も賢い。
今年4月、米コンサルティング会社の調査は、そんな結論を導き出した。
調査ではグーグルの 「グーグルアシスタント」 のほか、アップルの 「Siri(シリ)」 、アマゾンの 「アレクサ」 、マイクロソフトの 「コルタナ」 を対象に、一般的な検索や道順、翻訳などの質問を投げかけた。
グーグルアシスタントは9割超の質問に「正確かつ完全」に答え、他の会話型AIを圧倒した。
そんなグーグルアシスタントが、 「電話予約」 のスキルも身に付けた。
スマートフォンやグーグルホームなどのスマートスピーカーに、「OKグーグル、火曜の朝10時から12時の間に美容室の予約を取って」と話しかけてみると・・・。
・自然すぎるAIの相槌に会場はどよめき
美容室店員:こんにちは、いかがいたしましょうか?
(Hi,how can I help you?)
グーグルアシスタント:顧客の為に、女性用のカットの予約で電話をしています。5月3日に空きはありますか?
(I'm calling to book a woman's haircut for a client. I'm looking for something on May 3rd.)
美容室店員:分かりました。少々お待ちください。
(Sure,give me one second.)
グーグルアシスタント:はーい。 (Mm-hmm.)
5月8日、グーグルは年次開発者会議「I/O(アイ・オー)」の基調講演で、グーグルアシスタントによる電話予約のシステムを披露した。
まるで生身の人間のようなグーグルアシスタントの相槌に、会場の顧客からは驚きの声とともに大きな笑いが沸き起こった。
「5月3日の10時に予約が設定されました!」、グーグルアシスタントからお知らせが来れば完了だ。
この他、男性の声のアシスタントによるレストラン予約の様子も公開。
英語が完璧とは言えない店員を相手に、スムーズな会話を展開した。
さらに複雑な作業も可能だ。
ネット上に載っていないレストランの祝日の営業時間を アシスタントが電話で確認し、その情報をグーグル検索やマップに表示される店舗情報に投稿する といった事も出来るという。
「自然言語処理や機械学習、テキスト読み上げといった技術への長年の投資が可能にした」。
グーグルのスンダー・ピチャイCEOがそう力を込めた通り、「グーグルデュプレックス」と呼ばれるこの新技術には、これまでのAI研究の成果を結集させたといっても過言ではない。
グーグルは匿名化された通話データを自動音声認識技術で処理し、脳の神経回路を人工的に数式で表したニューラルネットワークを用いて、デュプレックスのモデルを作った。
ただ、1つのモデルが万能なわけでは無い。
美容院の予約、レストランの予約、祝日の営業時間確認という場面ごとにモデルを作らなければならなかった。
「これだけ自然な会話をAIで実現出来たのは、タスクを限っているからだ」(グーグル幹部)
・つなぎ言葉でより「人間」らしく
会話の内容だけでなく、自然な発声も重要だ。
音声合成技術を用い、会話の流れや文脈に沿ったイントネーションを実現した。
さらに、相手の発言を受けてアシスタントが次の発言を考える処理をしている間には、「Hmm」や「Uh」といった言葉で会話をつなぐ事で、『人間らしさ』を出したという。
「米国の小規模事業者の6割は、オンライン予約システムを持っていない。我々は、AIがこの問題の解決に一役買えると考えた」(ピチャイCEO)。
ユーザーにとっては、アシスタントに話しかけるだけで予約が出来るのだ。
さらに、 聴覚に障害があったり、その土地の言葉が不自由だったりしても、簡単に予約が可能 となる。
美容院予約、レストラン予約、祝日の営業時間の問い合わせ、これらの3機能は、 今後数週間以内に米国の一般ユーザー向けに試験運用が始まる。
ただ、デュプレックスの発表後、人間そっくりに話すAIが自らの正体を明かすべきではないかとの声がネット上などで相次いだ。
これを受けグーグル側は、5月10日に声明を発表。
「(デュプレックスは、自らがAIである事を)開示する機能を組み込んで設計されており、システムの正体が必ず適切に分かるようにする。
I/Oで披露したものは初期段階の技術デモであり、製品化の過程でフィードバックを取り入れていきたい」と説明した。
デュプレックスで生かされた音声合成の技術は、もう一つの新機能を生んだ。
AIが人間の棋士に勝ったとして話題になった「アルファ碁」を手掛けるグーグル子会社のディープマインドが開発した音声合成システムを活用し、アシスタントが新たに男性、女性の6つの声を手に入れた。
アシスタントの声は、スタジオで録音した一定数のパターンから音声合成であらゆる言葉を話せるように開発されている。
今回6つの声の他に、『サプライズ』として米国の有名R&B歌手ジョン・レジェンドさんの声が加わることも発表された。
アシスタントを通して有名人と疑似的に話す事が当たり前になるかも知れない。
この他、 発言のたびに「OKグーグル」と言わなくても会話が続くようになり、複数のお願いを同時にしたりといった新機能も今後加わる。
自然な会話を目指すアシスタントの開発は、着実に進んできた。
アシスタントを日常的に使おうとすると、ハードウェアは欠かせない。
グーグルは近年様々な部門に散らばっていたハードウェアの事業部をまとめ、製品群を急速に広げている。
2016年にはスマートスピーカーの 「グーグルホーム」 、スマホの 「ピクセル」 がそれぞれ米国で発売され、昨年はAIをフル活用できるノートパソコンやイヤフォン、小型カメラなども投入した。
・アシスタントが握るハードウェアの命運
「ここ数年でAIや機械学習の能力が上がり、グーグルの様々なアプリと共にリッチな体験を提供できるようになった」。
ハードウェア部門バイスプレジデントのスヴィア・コタリ氏は、製品群拡大の理由をそう語る。
アシスタントは、その体験の中心に置かれている。
アシスタント自体は、大きな収入を生んでいない。
だが洗練されれば、ハードウェアの魅力も高まる。
コタリ氏は、「我々はこのビジネスを大きくしたいという野望がある。ハードウェアは必ず、将来の収益成長の重要な部分を占めるようになる」と断言する。
グーグルアシスタントは、今後も会話型AIの先頭を走って行けるのか。
その成否は急成長を遂げるハードウェア事業、そしてグーグル全体の命運をも動かしそうだ。
※キャリアアップは、こちらをご覧ください?
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/7733501
この記事へのトラックバック