コロナデータ4

やること

時系列にそって、データをみてみる。

仮説

  1. 総人口の~%が感染すると、感染者の伸びは鈍化する。
  2. 病床占有率(病床数/感染者数)が~を超えると、重症者数が増える。

どちらもそれほどうまくはいかなそうではあるんだけど、とりあえず手を動かしてみる。

検証

全人口の感染率と新規感染者数

全人口の感染率infected_ratioは、100万人当たりの感染者数をもって表すとする。

全人口の感染率infected_ratio自体の推移

#  感染率
new_cases_smoothed_per_million = row_data['new_cases_smoothed_per_million']
infected_ratio = new_cases_smoothed_per_million.groupby(level = -1).cumsum()

f:id:iiiiikamirin:20201103113245p:plain

100万人あたりの感染者数が特に多いのは、ブラジル・アメリf:id:iiiiikamirin:20201103113353p:plain

最近の伸びが心配な、フランス・イギリス f:id:iiiiikamirin:20201103114342p:plain

インドは人口多すぎて、100万人あたりで比較すると全然すくない。 f:id:iiiiikamirin:20201103113624p:plain

infected_ratio vs 新規感染者数・死亡者数

感染率の推移が比較的似ていたアメリカとブラジルを比較

f:id:iiiiikamirin:20201103114023p:plain

  • ブラジル

f:id:iiiiikamirin:20201103114106p:plain

うーーん、感染率がこれくらいになると、新規感染者数の伸びが鈍化するみたいな関係を期待したけど、やっぱりなさそう。

病床占有率

病床数のデータがそもそも時系列でもないし、やっぱり関係なさそうだったから、割愛。