コロナデータ4
やること
時系列にそって、データをみてみる。
仮説
- 総人口の~%が感染すると、感染者の伸びは鈍化する。
- 病床占有率(病床数/感染者数)が~を超えると、重症者数が増える。
どちらもそれほどうまくはいかなそうではあるんだけど、とりあえず手を動かしてみる。
検証
全人口の感染率と新規感染者数
全人口の感染率infected_ratio
は、100万人当たりの感染者数をもって表すとする。
全人口の感染率infected_ratio
自体の推移
# 感染率 new_cases_smoothed_per_million = row_data['new_cases_smoothed_per_million'] infected_ratio = new_cases_smoothed_per_million.groupby(level = -1).cumsum()
100万人あたりの感染者数が特に多いのは、ブラジル・アメリカ
最近の伸びが心配な、フランス・イギリス
インドは人口多すぎて、100万人あたりで比較すると全然すくない。
infected_ratio
vs 新規感染者数・死亡者数
感染率の推移が比較的似ていたアメリカとブラジルを比較
- アメリカ
- ブラジル
うーーん、感染率がこれくらいになると、新規感染者数の伸びが鈍化するみたいな関係を期待したけど、やっぱりなさそう。
病床占有率
病床数のデータがそもそも時系列でもないし、やっぱり関係なさそうだったから、割愛。