One of my favorite things is ...

2020.02.20
XML
カテゴリ: データ分析
新型コロナウイルス 「COVIT-19」の感染者数の推移のデータを基にしたDash Board(ダッシュボード)を試作しています。今のところ9ページのレポートになっています。

↓ダッシュボードの試作です。下記リンクのページから利用できます。


グーグルのアカウントがあれば無料で利用できる、「データポータル(Data Studio)」というダッシュボードのサービスを利用しています。

日々のデータの追加処理では、「R」を利用しています。新しいデータの読み込み、「日付」の列の作成、データの追加・結合などは「R」で処理してCSVファイルに書き出し、CSVファイルをスプレッドシートで読み込んでいます。

そして、グーグルのスプレッドシート上のデータをデータポータルに読み込んで、パネルや表、グラフを作成しています。

​データポータルでは、日々追加される感染者数の新しいデータを、パネルやグラフ、表などで、わかりやすく表示させることができます。

【データの中の最新の日付を表示させたり、絞り込みに利用するには?】
ダッシュボードで使用しているデータは、1日に1度更新されますが、例えば、「データの中の 最新の」感染者数のデータをパネルに表示させようとすると、ちょっとした工夫が必要なようです。

もしかすると、簡単にできる機能があるのかもしれませんが、見つけられていません。

データポータルの「フィルター」を利用して、表示するデータの日付を設定できますが、データを更新するたびに「フィルターの日付」を変更する必要があります。

あるいは、ダッシュボード上で「期間選択」ができるようにして、ユーザーに日付を選択してもらうことも可能ですが、不特定多数の人が利用するレポートとしては、デフォルトで最新データが表示されるようにしておきたいものです。



「データの中の日付で、最新の日付に対応したデータ」 を表示させるというのは、既成の機能では難しいようです。

そこで、少し手間がかかり、完全な自動更新ではありませんが、下記のような方法で、最新データの表示を行っています。

まず、データはグーグルのスプレッドシート上で、下のような形になっています。




1.データの「日付」の列「Date」を参照して、「日付のシリアル値」の列を作成

「N(日付のセル)」という「N()」という関数などで日付からシリアル値を得ることができます。

 C列に日付のデータがあるとすると、「=N(C2)」といった入力になります。この関数を利用して、J列にシリアル値の列を作成します。

単に、「Date」の列を参照して、新しい列の表示設定を「数値」にする方法もあります。


2.「日付のシリアル値」の列を元にして、「日付のランキング」の列「DRank(名前は適当)」を作成

「RANK(当該セル,日付シリアル値の列全体,0)」といった関数を使います。

J列に日付のシリアル値があるとすると、K2のセルに=RANK(J2, J:J, 0)と入力し、K列全体にコピペします。


3.「日付のランキング」の列を利用して、フィルター機能でパネルや表などに表示させるデータを最新のものにします

「RANK()」関数では、3番目の引数を「0」とすると、最大値に対して「1」を返します。つまり、日付のシリアル値が最大になっているデータ(最新の日付のデータ)の「RANK()」関数の値は「1」になります。そこで、データ・ポータルのフィルターで「Drank」の列の値が「1に等しい」という条件でデータを絞り込むように設定します。

データの追加・更新時に、J列、K列といった2つの列を整えないといけませんが、データ・ポータルのフィルターの設定は一度しておけば、データ更新時にフィルター設定を触らなくても最新データが表示されます。

以上のような処理によって、下の図で言うと、「表」を利用した「Date」の表示、三つの「パネル」の表示は、「データの中の最新の日付のデータ」になります。



データポータルに、日付の最大値(最新値)を何らかの形で返すような関数があって、フィルターで利用できれば、手間は減ると思います。


もしかすると、そのような機能があったりするかもしれません。あるいは、上記の方法よりも簡単な方法があるかもしれません。いろいろと模索する必要があるようです。

今回、Excelは利用していませんが、データの読み込み元としてグーグルのスプレッドシートは利用しています。できれば、Rとデータポータルだけにしたいと思います。



なお、試作のダッシュボードでは、「JHU CSSE」の「Covid19 Daily Reports」のデータを利用しています。

EdgeブラウザやIEブラウザなど、Chromeブラウザ以外での利用の場合はうまく表示されないことがあるようです。





↓WHOのサイトでも、感染者数、地域などの「Situation Report」が日々更新されています。関心がある場合は、一日に一度見るといいのではないかと思います。





​​

↓中国の情報が詳細になっています。マップがメインのダッシュボードです


↓感染者数などのデータがまとまっています。新しい情報も速く反映されているようです。


​​







 新型コロナウイルス(2019-novel coronavirus)対策もインフルエンザ対策と同じで、手洗い、うがい、マスク着用(咳エチケット)などが対策になるようです。



病院で使用されているマスクなので安心感があります。 医療用不織布首位のメーカー製です。










★おすすめの記事 ​​

◆インフルエンザの流行が始まったようです:今年は流行の始まりが早いようです




◆Netflixの4半期決算報告で紹介されている作品は?:決算報告資料は、Netflixの話題作を探す一つの手段です






◆How Windows Sonic looks like.​​:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました












​​​ ​​
​​ ​​ ​​





お気に入りの記事を「いいね!」で応援しよう

Last updated  2020.03.01 15:41:59
コメント(0) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
X
Design a Mobile Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: