アフィリエイト広告を利用しています

広告

posted by fanblog

2023年03月15日

新型「NX」音声認識機能はついに実用的になってきたか?



しかし、今回、2023年2月更新の「OTA」アップデート後に更に改善されているということで、OTAアップデート当日は「それほど大きな改善はないなぁ」と感じてしましたが、どれほど改善されているのか改めて確認するために土日の空いている時間で数時間、時間をかけて向き合ってみました。

新型NX以降の新世代マルチメディアシステムにおいて、どのような「音声認識」ができるかは、レクサスの公式Webページにまとめられています。
当初はここまで詳しく解説されていなかったと思いますので、途中で大幅に加筆/修正されたものと思います。

https://lexus.jp/total_care/connected/navigation/agent.html

th_スクリーンショット 2023-02-05 23.26.59.jpg
*コネクテッドサービス「エージェント」:ー「ナビ検索・ナビ操作」より


数時間検証してみたところ、結論からすると、初期バージョンに比べると 「格段に良くなっています」
特に、 上記サイトに掲載されている事例はおおむね認識することができました

ただし、 認識できるコマンドと話し方を理解する必要がある と感じました。
これから納車される方は、まずは、どんなことができるのか、また どのように発言すれば認識してくれる かを公式Webサイトで学ぶ必要がありますので、一通りチェックしておきましょう。



さて、2023年2月のアップデートで大きく変わったと感じたのは「2段階」で車両(以後、AI)が認識するようになったことです。

例えば、 「ヘイ、レクサス。東京駅の近くで空いている駐車場探して」 と発音した場合です。

初期(2022.11月〜)や中期(2022.6月〜)では、こういった音声はなかなか認識してくれませんでしたが、2023年2月(以降、新バージョン)では、「カタカナ混じり」でAIが認識した用語をまず表示してくれるようです。

画面では「 トウキョウト の近くで アイテルチュウシャジョウ 探して」と認識に苦労している様子が伺えます。

th_th_DAAACB82-1DBE-418D-8C6B-DFDD51E51B12_1_201_a.jpg

従来だと、「東京 の近くで駐車場?」(そんなものは存在しない)と認識して、AIがフリーズして長時間応答がなく、我々ユーザーに「ああ、こりゃダメだ」と思わせていたものと思います。

それが、新バージョンですと、もう1度画面表示が切り替わり、正確に「東京 の近くで空いている駐車場探して」と認識してくれます! 「東京都」が「東京駅」だと認識を改めたわけですから、これは一体どういうロジックかわかりませんが、これには驚きました。

th_8D904E1E-28C4-4238-A032-453AC34E2234_1_201_a.jpg


次に、「ヘイ、レクサス。 品川駅の近くで空いている駐車場探して 」と発音した場合・・・

まず画面には、「 シナガワエキフレアイビル チュウシャジョウ探して」と表示されました。
当方の発音がイマイチなのかもしれませんが、 「シナガワエキフレアイビル」 と謎の認識をしていることにも驚きがあります。
大部分がカタカナなので、従来のバージョンでは、この段階でAIが「思考停止」し、フリーズするか、見当違いな結果を表示していたものと思います。

th_D72985C0-8160-4847-93B4-CDABEE869268_1_201_a.jpg

この後自動的に画面が切り替わり「 品川駅の近くで空いている 駐車場を探して」と正確に認識しました!
「フレアイビル」がどういうロジックで「近くで空いている」に変換されたのかも謎が深まりますが、これはかなりすごい!(やればできる!)

IMG_9161.jpeg


最後に使用頻度が高い「自宅に行きたい(自宅に帰る)」ですが・・・
これもまずはこんな感じで、「 キタク に行きたい」と、とんでもない認識です。こりゃ、当初は使い物にならないと感じたわけです・・・(北区に行きたいと認識しているのか?)

th_9D366EF9-BC69-47C6-AA9E-50EDB1D5C82E_1_105_c.jpg

これも画面が切り替わり、無事に「自宅に行きたい」に変換してくれました!
多少認識に時間はかかりますが、変な目的地を検索するという結果にはならず、大成功です。

th_3911A1C4-F7BE-4060-86AB-7057A4DA3256_1_201_a.jpg


この他にも

「近くの○○○○」と発声する場合の音声認識は、認識率が格段に良くなっていることがわかりました。

「近くのスターバックス」
「近くのタリーズ」
「近くのファミレス」
「近くのドラッグストア」

上記のように、著名なチェーン店名も、新バージョンでは難なく認識することができたので、馴染みのない旅行先で立ち寄り場所を探すときには 「近くの○○○」はなかなか有効 と感じます。
(「近くの○○○○に行きたい」 という必要はなく、「近くの○○○○」だけで良いのは便利ですね)
その他、「地図にコンビニを表示する/非表示にする」のも音声認識でできるようになっているのは、普段都市部で生活していて、週末にゴルフに行かれる方などは便利と思いました。
(これを運転中にタッチパネルで操作しようと思うと、タズナから手が離れて落馬しそうになります…)

・・・ということで、2023年2月のアップデートにおいて、ようやく音声認識機能が実用的になってきたと感じました。
ただ、これは繰り返しになりますが、「認識されるコツ」や「話し方」がありますので、上記のページおよび、 レクサス開発陣の「TEAM LEXUS BLOGS 」をご参照の上、トライしてみてください。
特に初期納車された方は、ぜひ新バージョンの音声認識を試していただければと思います。


当方が現時点での望む、今後の要望としては次のことができるようになってほしいです。


■音声での目的地検索のオン/オフ

誤作動の原因は無限のパターンがある「目的地検索」と思いますので、この機能の「オン/オフ」ができれば、誤認識は相当減らせるのではないかと思います。もしくは音声検索で検索できるエリアを限定するとか・・・
ユーザーが感じるストレスの原因は「AIが誤認識」→「見当違いな目的地を検索」が主要因と思いますので・・・
流石に、東京で音声検索して、四国エリアの目的地を目的地候補として表示するのはあまり現実的ではないように思います。


■次のインターチェンジで降りたい

都市部に限らないと思いますが、ナビで示されたインターチェンジの手前で一般道に降りたい場合もしばしばあると思います。
このような場合、一度インターチェンジを降りても、再度高速道路に乗ることを支持されたり、高速道路走行のままであったりしますので、「自分はここから一般道で走行したい」意識を伝えることができればとても役立つと思います。これこそが音声認識ならではの機能と思いますので、ぜひ実現してほしいと思います。


■次のインターチェンジで乗りたい

上記のケースとは逆のパターンです。
都市部ではインターチェンジ間の距離(間隔)が短いことも多いです。料金の問題や渋滞の有無など、もう1つ先のインターチェンジまで「下道で行きたい」と思うこともしばしばあると思いますが、これを手動でナビに反映させるのは結構たいへんです。これが音声認識で対応してもらえるととても便利と感じます。


■ルート検索後の「一般道優先」/「有料優先」の切り替え

これはかなりニーズが高いと思うのですが、途中でルート検索方法を変更したいケースです。(高速道路を走行中、料金節約のため、一般道に降りるケースも含む)現状では、音声認識での変更方法はなさそうです。任意で下道に降りたのに、再度有料道路に乗ることを指示(案内)されることに不満を持つ方は結構いらっしゃるのではないかと思います。


■ドライブセレクトモードの変更

新型NXではドライブモードセレクトスイッチが付いているので問題ありませんが、「RX」、「RZ」では非装備ですので、ぜひ音声認識でドライブモードセレクトスイッチの切替替えがスムーズに(かつ「素早く」)できるようになってほしいです。


■効果音の変更(AIが認識しているかどうかの見分け方)

AIが「認識しているのか」「考えているのか」の区別が未だつきにくいです。
「無音(無反応)」の時間は、最新バージョンでもまだ気にあるところですので、AIが「調べているのか」、「エラーなのか」がまだまだシチュエーションが分かりづらいと思います。人間なら「表情」や「あいずちの有無」でわかるのですが、AIだとそのあたりがさっぱりわからないので、せっかく目の前に14インチディスプレイがあるのですから、これを補う方法が欲しいものです。
また、対話終了後の効果音(ビープ音?)も、「OK」なのか「キャンセル」なのか今ひとつ判然しないときがあるのも残念に感じます。


■使用頻度が高い発音例の表示

レクサスオーナーがよく使うもしくは全国的に人気の高い「用語」を「ヘイ、レクサス」のあとに14インチディスプレイに自動的に画面表示してくれると良いなぁと思いました。(やはり、「どうやって対話すれば良いのか」はつい忘れてしまいますので・・・)


■パノラミックビューモニター中の音声認識

パノラミックビューモニターを「オート」にされている方は、徐行走行中に、「PVM」の画面になっていることが多いと思いますが、音声認識はこのときには受け付けられません(カメラ関係の音声のみ認識)
個人的には、このような低速度域だからこそ、音声認識を行う余裕があると感じますので、「PVM」の画面のときも音声認識を受け付けてほしいと思いました。

■音声の個人ごとの学習機能

個人ごとに発音の癖があると思いますので主要なフレーズをあらかじめ実際に発声して認識率を高めるなど「学習機能」をもたせてほしいと思います。「ドライバー認証」の際に、その情報が呼び出されるのであれば認識率もより高められるのではないかなぁと感じています。
■できないことでも聞き取った内容は表示して欲しい

現時点では機能的にできないことでも、画面上では聞き取った対話は表示して欲しいと感じます。
例えば、運転席からは「助手席の窓を開けて」の音声は認識しないようなのですが、そもそも音声を聞き取っていないのか、その機能ができないのかがわかりません。
この場合、「運転席側からはその操作はできません」と言ってくれれば納得すると思います。



「TAZUNA」コンセプト移行後、運転席のタッチディスプレイから手の届かない範囲(画面の左隅など)にボタンやスイッチが配置されている部分がありますので、こういった部分の操作を「音声認識」で置き換えたり、ワンクリック(タップ)ではできないことを、「音声認識」で置き換えることがとても有用と思います。

手元のステアリングスイッチでできることは音声認識でやる必要はないようにも思いますので、ユーザーが「こうしたことをやってほしい」と販売店やメーカーに意見を伝える仕組みがあれば良いなぁと感じます。
ユーザーが今何をやりたいかをAIが感じ取ってくれるのであれば、大変魅力的に感じます。
車の中ということもあり、やりたいことはある程度限定されると思いますので、今後も「音声認識」の機能が進化していくと、更に魅力を増していくように思います。

音声認識機能はぜひ今後も操作改善が望ましい「TAZUNA」を補うツールとして進化していってほしいですね。


この記事へのコメント
コメントを書く

お名前:

メールアドレス:


ホームページアドレス:

コメント: 必須項目

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバックURL
https://fanblogs.jp/tb/11905256
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック

ユピテル レーダー探知機オプション OBD12-M III OBD12M3[OBD12M3]

価格: 5,540円
(2019/5/18 10:16時点)
感想(1件)

協和興材 マイクロロン ガストリート【smtb-s】

価格: 3,492円
(2019/5/18 10:15時点)
感想(0件)

スポンサーリンク

ACDelco [ エーシーデルコ ] 輸入車バッテリー [ Premium EN ] LN3

新品価格
¥12,754 から
(2019/10/14 18:36時点)

AESOP/イソップ レバレンス ハンドウォッシュ 500ml (B500BT17)

価格: 4,428円
(2018/5/27 02:12時点)
感想(1件)

イソップ Aesop リンスフリーハンドウォッシュ 50ml [003024]

価格: 1,020円
(2018/5/27 02:14時点)
感想(2件)

<< 2024年12月 >>
1
2 3 4 5 6 7
8
9 10 11 12 13 14
15
16 17 18 19 20 21
22
23 24 25 26 27 28
29
30 31
最新記事
検索
カテゴリアーカイブ
最新コメント
ファン
プロフィール
なまっくすさんの画像
なまっくす
LEXUS車の話題を中心になるべく独自の視点でのんびり気ままにコメントしております。(車のメカニズム等の知識は全然ありませんのでご容赦願います)
QRコード
×

この広告は30日以上新しい記事の更新がないブログに表示されております。

Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: