漂流録-ScrambleHalloween

漂流録-ScrambleHalloween

2021.02.25
XML
カテゴリ: 時事


Clubhouseで楽しさを知った会話の「輪」はさらに広がる 「音声」の重要性を改めて考えてみた - 記事詳細|Infoseekニュース
最近「音声」の話題が増えている。Clubhouseのヒットも音声がらみだし、日本で春に向けて大手携帯電話事業者が打ち出す料金プランの中でも「通話」の扱いがポイントになってきている。コミュニケーションとしての「音声」とコンテンツとしての「音声」、方向性は違うものだが、奥底にある「声」という要素には共通…





Clubhouseで楽しさを知った会話の「輪」はさらに広がる 「音声」の重要性を改めて考えてみた
ITmedia NEWS / 2021年2月25日 7時35分

写真
現在もApp StoreのSNSランキングで2位(1位はLINE)

 最近「音声」の話題が増えている。Clubhouseのヒットも音声がらみだし、日本で春に向けて大手携帯電話事業者が打ち出す料金プランの中でも「通話」の扱いがポイントになってきている。

 コミュニケーションとしての「音声」とコンテンツとしての「音声」、方向性は違うものだが、奥底にある「声」という要素には共通性があり、さらに、データ通信コスト構造の変化が強い後押しとなっている点も共通している。

 「音声」とそれを取り巻くテクノロジーの今について、少し考えてみることにしよう。

●音声コミュニケーションとその歴史

 言うまでもなく、アナログ技術が主軸である時代から、「音声」はコミュニケーションにおいても、コンテンツにおいても重要なものだった。アナログの場合、音を信号に変えて記録したり伝送したりするのは比較的シンプルな技術であり、映像や文字に比べて早期から品質を高めやすかった、ということはあるだろう。

 そもそも人間にとって、「声」は最も原初的なコミュニケーション方法である。「読み書き」は学習の結果獲得する能力。アナログ時代でもモールス信号のような技術なら声よりももっと簡単に実現できたわけだが、通常の読み書きを習得した上でさらにモールス信号を覚えなければいけないので、マスに利用してもらうためのハードルは意外と高い。

 コンピュータとネットワークの進化によって、多くの人が「文字でのコミュニケーション」が可能になったのは1980年代以降だから、「ラジオ」「レコード」「電話」という存在がいかに長く使われ、基盤となっているかが分かろうというものだ。

 ただし、過去40年ほど(すなわち、技術が高度化していった時代)を考えると、音声は基盤でありつつも、少しずつ主軸からずれていった。エンターテインメントにおいては「映像」の価値が高まり、コミュニケーションにおいては「文字」の価値が高まったためだ。

 特に、ネットワーク技術定着以降の「文字」の重要さについては、いまさら説明するまでもないだろう。電話は「相手と時間を合わせて話さないといけない」が、文字ならば、メールなどの形で相手に送っておくことで「非同期コミュニケーション」が可能になる。また、SNSのように大量のメッセージを流し、フローとして扱うこともできるようになった。

 声には「内容を把握するために一定の時間が必要である」「相手も同じ時間を過ごさないといけない」という特質があり、ネットワークによる文字ベースの非同期コミュニケーションは、音声コミュニケーションの面倒な部分を解消したため、急速に広がった部分はある。


「もうあまり電話しない」「音声コミュニケーションはしない」という人もいるが、それは、文字ベースのコミュニケーションが持っている快適さが音声コミュニケーションの持つ不都合さを超えた、と感じているからだろう。

●コロナ禍で見えた「日常としての音声」の重要性

 ただ、その見方は一方的なものでもある。

 コミュニケーションだけでも、みなさんもそう感じているのではないだろうか。リアルに集まりづらい状況が続いていると、実は日常の「近い距離」でのコミュニケーションが音声に依存していたことに気付く。

 仕事場でのコミュニケーションもそうだが、筆者が特に感じるのは、イベントなどでの「立ち話」の重要性だ。オンラインイベントになって人と会えなくなった結果、立ち話での軽いコミュニケーションが減った。イベントや学会などで、廊下で人と会って立ち話をすることによって得られるものは、決して小さなものではない。それは現状の技術だと、文字では再現が難しい。

 また、意外と忘れがちなことではあるが、「タイプして文字でコミュニケーションすること」はそれなりに脳を使うタスクであり、全ての人が好むわけではない、という点もある。「何かというと電話してくる人」はオールドタイプで嫌われるというイメージがありそうだが、彼らの視点から見れば、「話せば数分で終わることで、なぜ文字を打たなければいけないのか」という意見になる。それを単純に否定するのは間違っている。

 音声というシンプルでインスタントなコミュニケーションには独自の価値がある。リアル+ネット、という当たり前の関係が問題なく機能している時には感じられなかったが、むしろコロナ禍では「基礎としての音声コミュニケーションの重要さ」が再確認された部分がある。

 また、ラジオが根強い価値を持っていることから分かるように、エンターテインメントの中での「音声」にはそもそも重要な価値がある。目を奪わず、ながらで消費しやすいコンテンツ、という価値は小さなものではない。

 ポッドキャストやオーディオブックなどのマネタイズでは、アメリカなど海外の方が進んでいる。それは、自動車移動が長い国だと、日本以上に音声コンテンツの価値が高いからだろう。また、日本の場合、ネットでのコンテンツビジネス自体がこれまで極度に都市型であり、運転時間の長い地方の方を向いていなかった、という部分もありそうだ。そもそも日本でも、ラジオの熱心な支持者はプロ運転手の方々などの、運転時間の長い人々であり、欧米同様、音声コンテンツの価値を高める方法はある、と考えている。
むしろ日本で面白い傾向だと思うのは、YouTuberの作るコンテンツの多くが「ポッドキャスト的」だ、という点だ。映像よりも音声での説明に重点を置いており、映像を見ていなくても成立するものが少なくない。結局、映像がついているのは「YouTubeという場でマネタイズがしやすいから」であり、「写真やテロップで目立たせやすいから」でもあるのだろう。

 だとするならば、音声コンテンツをうまく目立たせ、マネタイズする方法論が増えてくれば、現在のYouTuberの一部は音声コンテンツへと移行するのではないか……という気がする。

●「データ定額」時代の通話常識とは

 一方、通話については、音声のコスト構造を大きく変えるものが現れる。といっても、別に最近のことではない。固定回線では20年近く、モバイル回線でもここ数年普通になり始めた「使い放題」という考え方だ。

 その昔、音声通話は「距離」「時間」で価格が決まっていた。長距離通話料金の低価格化と、携帯電話による通話が基本になってくることで、音声通話のコストは「時間」ベースになった。

 だがそれも、音声をデータ通信の上に乗せるのが当たり前になると、データ量によらず料金は一定、という形になるため、「通話し放題」になっていく。電話を中心とした特殊なものだけが時間単位での課金になっている、といってもいいだろう。この点は、年齢が上で、電話とともに過ごしてきた世代であればあるほど、どこかで勘違いしがちになる。

 若い学生の間では、「友人との間でLINEの音声通話をつなぎっぱなしにして勉強する」というスタイルが当たり前になっている。ひところ流行った「Zoom飲み会」も同様だ。そもそも、オンライン会議は「通信定額」でないと安心してやりづらい。

 携帯電話などの通話に時間単位課金が残っているのは、「ある程度確実に着信するインフラ」の整備にはコストがかかるためでもある。とはいえそこでも低コスト化が進んだために、通話定額のような料金体系も提示されるようになってきた。

 データ定額(もしくは大容量プラン)があるなら通話定額は不要と思う人がいるのは当然で、そういう使い方がようやく定着してきた感はある。一方で、電話としての確実な着信や、遅延がより低く信頼性の高い通話を求める人もいるだろう。だが、そこはやはり、「音声での対話についてどのような印象を持っているか」というこれまでの習慣的な部分が色濃く出ているのではないかと思っている。だとするならば、コロナ禍でオンライン会議を体験した人が増えた今後は、「通話は定額でなくてもいい。そこはネット通話で済ませる」という人がさらに増えるのではないか、と予想できる。



KDDIの「povo」やソフトバンクの「LINEMO」は、低価格プランでありながら、通話定額を外して月額料金を下げ、1カ月の利用データ量を20GBにしている。若い層を狙ったプランだから、と説明されることが多いが、これは、上記のような事情を考えれば納得できる話ではある。一方で、NTTドコモの「ahamo」に「5分以内の通話定額」がついているのは、電話サービスについて、より保守的な考え方であるとも感じる。

 楽天モバイルは、通常の電話回線通話は他社と同じく、30秒あたり20円という「時間課金型」であるにも関わらず、自社アプリRakuten Linkによるネット通話を推し、「通話ゼロ円」をアピールする。まあそれはそうだろう……と思うし、正しい方向性だと思うが、この二重構造を自然に理解して使うには、意外とリテラシーが必要であるようにも感じる。

●低遅延や空間オーディオ、新しい「音声コミュニケーション」の可能性

 このような背景の中でClubhouseが出てきた。サービスの評価についてはいろいろあると思う。これがこのまま定着するのか、一時の流行に終わるのかは分からない。

 だが、Clubhouseのもたらしたものは2つあると分析している。

 一つは、気軽に会話の「輪」を作れることだ。先ほど、「イベント待ちの廊下の会話が重要」という話をしたが、Clubhouseはこれに近い。場の設計として、話者とオーディエンスが分かれていつつも、話者の中にも気軽に入っていける構造を持っているのは、ちょっとした「仲間内の会話」感があり、さらに、それを人が聞く楽しさもある。カジュアルなトークショーを作る場としての価値は高い。

 そして二つ目は「遅延の小さな対話の場の大切さ」だ。正確に測ってはいないが、ClubhouseはZoomやTeamsなどと比較しても音声の遅延が小さい。そのため、人と話すときにより噛み合いやすく、お見合いになりづらい。遅延の小さな通話サービスは他にもあり、主にゲーマー向けに使われている「Discord」が有名だ。実際、Discordで会社のチームの音声チャットルームを作ると、遅延が小さいので「バーチャル出社のようだ」という評判もあるくらいだ。遅延の小さい音声通話には価値があるのだが、遅延は目に見えづらく、ZoomやTeamsの勢いが大きかったために目立ちづらい部分があった。

 だが、Clubhouseは、改めて「遅延の小さい対話空間」の価値を知らしめてくれた。今後出てくるサービスでは、同様に、遅延の小ささをアピールするサービスも増えるのではないか、と思っている。


音声通話には、まだ開拓できていない方向性もある。それは「対話する向きやゾーン」の再現だ。Facebook CTO(最高技術責任者)のマイク・シュレーファー氏に先日インタビューをした。そこで彼は、VRでのオフィス環境の可能性について、こんな話をしている。

この1年でわれわれは、2Dの画面を使ったリモートワークの楽しさと限界を学んだはずだ。だが、ビデオ会議では、2~3人が同時に話したり、隣の人とだけ軽く会話をしようとしたりしても、うまくいかない。しかし現実の世界では、みんなが顔を向けて1人の人を見つつ、どこで話しているのかを理解できる。『空間化された音声』として届くからだ

 誰がどこにいて、音声がどこからどの方向に届くのか、という技術が自然に使えるようになれば、確かに、音声での対話はもっと自然で楽なものになるだろう。

 ステレオで聴こえる音声、というのは基本的な要素だが、音楽や映画で「空間オーディオ」が重要になるように、コミュニケーションでも同じような要素が大切になる時代が来るかもしれない。その時には、Clubhouseのように音声だけで成立するのではなく、映像とセットになって体験を変えるものになるのだろうとは思うが。

※この記事は、毎週月曜日に配信されているメールマガジン『小寺・西田の「マンデーランチビュッフェ」』から、西田宗千佳さんのコラムを転載したものです。






お気に入りの記事を「いいね!」で応援しよう

最終更新日  2021.02.25 11:57:21
コメント(0) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
X
Create a Mobile Website
スマートフォン版を閲覧 | PC版を閲覧
Share by: