One of my favorite things is ...

2020.02.25
XML
カテゴリ: データ分析
​​ グーグルのデータポータルのダッシュボードで、インフルエンザの「定点当たり報告数」のデータをグラフで表示してますが、都道府県別に表示できるページを追加しました。

全国と47都道府県の計48通りのインフルエンザの「定点当たり報告数」の推移のデータをグラフ化できるので、便利だと思います。

国立感染症研究所のサイトから週ごとの都道府県別のデータをダウンロードしました。2012年第37週までは、CSVファイルへのリンクがあるので、Rで「for i」のループでダウンロードし、同じく
「for i」のループでダウンロードしたファイルを読み込んで整形しました

年によって、列数(感染症の種類)が変わったりしているほか、
「年」の変数の列も追加する都合もあるので 、年単位で 「for i」のループを回して読み込みました。2013年は年の途中から列数が異なっていて、分割して読み込んでいますが、第49週以降がうまく読み込めていないため、ダッシュボードでは2014年からのデータになっています。「R」では、データの読み込みでトラブルが生じることがあるようです。

2012年のデータもうまく読み込めていないところがあります。問題が解決すれば、2012年の第37週以降のデータを利用できるようになります。2012年第36週以前のデータは、「IDWR」のPDFに表がありますが、PDFの表を大量に読み込みのは難しいので、今後の課題です。データがCSV形式で公開されているというのはとてもありがたいことだと改めて思います。

【13年と12年のデータも読み込みました】
read.table()の引数で、「quote=""」として読み込むと、文字や数字が引用符””で囲まれて読み込まれました。この引数なしだと、多くの部分が「NA」となってしまっていました。write.csv()で「quote=F」とすると、引用符を取り除くことができました。
別の方法として、「stringsAsFactors = FALSE」の引数設定でも無事読み込めることを確認しました。「stringsAsFactors = FALSE」の方法が簡単です。


ダッシュボードの左下のところでページ選択ができます。

都道府県別に表示できるのは、ダッシュボードの2ページ~5ページです。プルダウンメニューで「都道府県」を選択してグラフを表示させます。

↓下の画像は北海道のグラフですが、新型コロナウイルスの感染者も多く確認されている北海道では、インフルエンザの「定点当たり報告数」の第7週は前週より増加しています。寒気の影響もあるのでしょうか。気温など、天候の影響は大きいのではないかと思われます。







国立感染症研究所から毎週発表される、インフルエンザの「定点当たり報告数」のデータをグラフとして見ることができるダッシュボードを作成しました。

毎週の報告数のグラフと、報告数累計のグラフの2種類です。


グーグルのデータポータルによるダッシュボードです。

※Edgbブラウザや IEブラウザ など、Chromeブラウザ以外ではうまく表示されないようです。








★おすすめの記事  ​​








◆インフルエンザの流行が始まったようです:今年は流行の始まりが早いようです





◆Netflixの4半期決算報告で紹介されている作品は?:決算報告資料は、Netflixの話題作を探す一つの手段です

◆Netflix (NFLX)の第3四半期決算発表で、NFLXの株価上昇:1株利益が予想を上回る:「ストレンジャー・シングス」効果?で有料会員数の増加数は前年同期を上回る





◆How Windows Sonic looks like.​​:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました















​​​ ​​ ​​

​​





お気に入りの記事を「いいね!」で応援しよう

Last updated  2020.02.28 08:13:43
コメント(0) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

© Rakuten Group, Inc.
X
Mobilize your Site
スマートフォン版を閲覧 | PC版を閲覧
Share by: