One of my favorite things is ...

2020.05.07
XML
カテゴリ: データ分析
​​​ 新型コロナウイルスの実効再生産数・Rtを、R言語の「EpiEstim」パッケージを利用して、国別に計算できるようにしました。60カ国以上について、一度に計算しています。





下記のコードのようなループ処理は、都道府県別や州別のロング型データにも同様に適用でき、一度に多くの計算をすることができます。

国・地域のリストのループ処理によって多くの国・地域の値を一度に計算していますが、日々の感染確認者数のデータが100日分以上ある国について、実効再生産数・Rtを計算しています。

今日の処理では、100日分以上のデータがある66か国が計算対象になっていました。


なお、感染間隔(Serial interval) のパラメータは、​ 西浦先生らによる論文「Serial interval of novel coronavirus (COVID-19) infections」 ​で示された、平均値4.7と標準偏差2.9を利用しています。

計算した実効再生産数・RtをECDCのデータを利用したダッシュボードでグラフ化しています。プルダウンメニューで国を選んで、グラフを表示させることができます。


下記のRコードで用いている「EpiEstim」のパッケージは、 「Improved inference of time-varying reproduction numbers during infectious disease outbreaks」 ​という論文に基づいています。

↓「EpiEstim」パッケージでは、感染間隔の分布の情報と日々の感染者のデータから実効再生産数・Rtを計算する仕組みになっています。ベイジアンの手法が用いられています。下記のコードの太字の部分が、 「EpiEstim」パッケージに関するコードです。



【↓Rのコード例です:いろいろと必要なパッケージがありますが省略しています。というよりも、普段からたくさんのパッケージを読み込んでいるので、必要最小限のパッケージが特定できません】

【5月17日:発病間隔のパラメータを平均 4.8 、標準偏差 2.3 に変更します。18日のデータ更新から反映させます。日本科学技術ジャーナリスト会議のニコニコ動画で、利用されているパラメータがわかりました。これまで、同じ論文中の別のパラメータを使用していました】


library(EpiEstim)

df_ECDC <- read.csv("https://opendata.ecdc.europa.eu/covid19/casedistribution/csv", na.strings = "", fileEncoding = "UTF-8-BOM")

#ダッシュボード用データでは、スペインのデータが1日分(1行分)欠損しているのを補う処理をしています。

geo_list <- unique(df_ECDC$countriesAndTerritories)​​
df_ECDCtemp <- df_ECDC

df_Rt <- NULL
temp_Rt <- NULL

for (i in seq_along(geo_list)) 
 {
 df_ECDCtemp1 <- subset(df_ECDCtemp,df_ECDCtemp$countriesAndTerritories==geo_list[i]) 
 df_ECDCtemp2 <- subset(df_ECDCtemp1,df_ECDCtemp1$cases >= 0)
 if (length(df_ECDCtemp2$cases) >=100)
 { rt_parametric_si <- estimate_R(df_ECDCtemp2$cases,method = "parametric_si",config = make_config(list(mean_si = 4.8, std_si = 2.3))) 
  temp_Rt <- rt_parametric_si$R
  temp_Rt <- mutate(temp_Rt,countriesAndTerritories=geo_list[i])
  df_Rt <- rbind(df_Rt, temp_Rt)}
 else {print(geo_list[i])}
}
df_Rt <- df_Rt[,c(1,3,12)]

#ECDCのデータの国・地域の列から、国・地域のリスト(重複のないリスト)を作成します。そのリストを使って、国別・地域別のデータを抽出し、計算処理を行います。計算結果に国・地域の情報を足して、保存します。この一連の結果の追記を繰り返します。中にはデータ件数が少ない国・地域があって、計算のエラーが生じたので、分岐処理を加えています。
--------------------------------------------------------------------------​​​

↓実効再生産数を計算できる Webアプリがあります。


​↓倍加時間についてです。

--------------------------------------------------------------------------​​​






​【ダッシュボード 「COVID-19 Transition Graphs」 を試作】​​
中国本土以外の地域への感染が拡大しているため、国別、地域別の感染者数の推移を簡単に確認できるダッシュボードを試作しています。​

随時、ページを追加しています。グラフのデータは、右上部分の操作でダウンロードすることができます。

アメリカの「地域別の変数」を前処理して、「州別」での推移をグラフ化できるようにしました。

また、州コードのフィールドを作成してコロプレス地図も作成しています。

楽天ブログでは「iframe」タグが使えないので、Bloggerのページから利用できるようにしています。

無料で利用できる、グーグルの「データポータル」のダッシュボードです。データさえあれば、簡単に作成できます。「国」別、「地域」別に日ごとの感染者数の推移を見ることができます。

↓ダッシュボードの試作です。下記リンクのページから利用できます。
​​

ジョンズ・ホプキンス大学の 「JHU CSSE」の「Covid19 Daily Reports」のデータを利用しています。

直近のアメリカのデータは地域分類が細かくなっていて、1日当たり2千行くらいになっています。
EdgeブラウザやIEブラウザなど、Chromeブラウザ以外での利用の場合はうまく表示されないことがあるようです。

上記のダッシュボードのデータの出所のサイトです。マップがメインのダッシュボードです






↓WHOのサイトでも、感染者数、地域などの「Situation Report」が日々更新されています。関心がある場合は、一日に一度見るといいのではないかと思います。






↓日本のインフルエンザの「定点当たり報告数」をグラフ化できるダッシュボードを試作。都道府県別にグラフ化可能です。



​------------------------------------------------------
 新型コロナウイルス(2019-novel coronavirus)対策もインフルエンザ対策と同じで、手洗い、うがい、マスク着用(咳エチケット)、免疫力アップなどが対策になるようです。​



★おすすめの記事 ​​







​​ ◆How Windows Sonic looks like.​​:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました








​​


​​​​​






お気に入りの記事を「いいね!」で応援しよう

Last updated  2020.05.17 18:45:39
コメント(0) | コメントを書く


【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! -- / --
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
X

PR

Free Space











Rebatesお友達紹介キャンペーン

​​ ​​

Comments

digital_21 @ Re[1]:◆【新型コロナ】やっぱり、PCR検査(08/02) 背番号のないエース0829さんへ すてきな内…
背番号のないエース0829 @ Re:◆【新型コロナ】やっぱり、PCR検査 「日本一遅い成人式が、無事終了 !!」に、…

Keyword Search

▼キーワード検索


© Rakuten Group, Inc.
X
Create a Mobile Website
スマートフォン版を閲覧 | PC版を閲覧
Share by: