One of my favorite things is ...

2020.03.10
XML
カテゴリ: データ分析
グーグルのダッシュボード「データポータル」で、各年のインフルエンザシーズンの週別データをグラフ化するためのデータの前処理の方法です。

​【ワイド型データをロング型にする】​
Excelなどでは、「行が年、列が週」のデータ形式(ワイド型)であっても年別の折れ線グラフを作成できますが、データポータルでは、ロング型のデータ形式でないと簡単にグラフを作成することができません。

なお、データポータルの機能では、ワイド型データをロング型に変換できないようです。グーグルスプレッドシートの場合でも「スクリプト」を利用する必要があり、簡単ではありません。

ワイド型データをロング型に 簡単に 変換する方法としては、ExcelやPower BIの「パワークエリ」で、「列のピボット解除」のメニューを利用する方法があります。

あるいは、下記のような「R」のコードでも簡単に変換することができます。

下記のコードでは、1列目が「年」の変数、2列目から54列目が第1週から第53週のインフルエンザの定点当たり報告数のデータを、「年」「週」「定点当たり報告数」の3列のロング型データに変換することができます。


df_long <- df_wide %>% gather(key=weeks,influ,2:54)

​【X軸の「週」の並び順を設定する】​

インフルエンザシーズンは、第36週から第35週という形で、年をまたいでいます。この場合、期間をX軸(横軸)にとってグラフを作成する場合、第36週から第35週にかけて順に並べる必要があります。

データポータルでは、列(変数)に「年」「週」「定点当たり報告数」といった3列があるロング型であれば、横軸に「週」をとって、「年」別の折れ線グラフを作成できますが、「週」の並び順を整える必要があります。

「R」 の場合は、「週」の列をfactor型にして、「週」の順序を設定すればいいのですが、データポータルで順序を設定するには、もう1列、順序の変数(列)が必要になります。

「R」で、第36週から第35週という順序を設定した「週」の変数について、「mutate(as.numeric(変数))」とすると、順序の数字の列が得られます。

この順序の数字の列を利用して、データポータルで「並べ替え」の設定を行うと、「週」を第36週から第35週へと並べることができます。




国立感染症研究所から毎週発表される、インフルエンザの「定点当たり報告数」のデータをグラフとして見ることができるダッシュボードを作成しました。

毎週の報告数のグラフと、報告数累計のグラフの2種類です。


グーグルのデータポータルによるダッシュボードです。

都道府県別のページを追加しています。左下のところでページ移行ができます。


※Edgbブラウザや IEブラウザ など、Chromeブラウザ以外ではうまく表示されないようです。



★おすすめの記事  ​​








◆インフルエンザの流行が始まったようです:今年は流行の始まりが早いようです





◆Netflixの4半期決算報告で紹介されている作品は?:決算報告資料は、Netflixの話題作を探す一つの手段です

◆Netflix (NFLX)の第3四半期決算発表で、NFLXの株価上昇:1株利益が予想を上回る:「ストレンジャー・シングス」効果?で有料会員数の増加数は前年同期を上回る





◆How Windows Sonic looks like.​​:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました















​​​ ​​ ​​ ​​

​​
​​ ​​





お気に入りの記事を「いいね!」で応援しよう

Last updated  2020.03.11 06:06:26
コメント(0) | コメントを書く


■コメント

お名前
タイトル
メッセージ
画像認証
上の画像で表示されている数字を入力して下さい。


利用規約 に同意してコメントを
※コメントに関するよくある質問は、 こちら をご確認ください。


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: