2020年から流行が続いている新型コロナウイルス感染症(COVID-19)ですが、今回はKaggleに投稿されているデータを用いて、コロナウイルスの致死率を都道府県別に比較します。
今回使わせていただくデータは、Kaggleに投稿されているDatasets”COVID-19 dataset in Japan“(本記事では2021年6月21日現在のデータを使用)です。
では、早速KaggleのNotebookを使ってデータを開いてみます。
(データの仕様が変更となった場合、下記コードをそのまま実行しても上手く動作しないことが考えられます。データについて詳しく知りたい場合は、データ作成者の方が書かれたNotebookをご覧になることをお勧めいたします。)
import os
for dirname, _, filenames in os.walk('/kaggle/input'):
for filename in filenames:
print(os.path.join(dirname, filename))
import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
jp_prefecture = pd.read_csv('../input/covid19-dataset-in-japan/covid_jpn_prefecture.csv')
total = pd.read_csv('../input/covid19-dataset-in-japan/covid_jpn_total.csv')
metadata = pd.read_csv('../input/covid19-dataset-in-japan/covid_jpn_metadata.csv')
latest_data = jp_prefecture.tail(47)
per_hunthousand = []
for i,j in zip(latest_data["Positive"],metadata["Value"]):
per_hunthousand.append((i/int(j))*100)
latest_data["Cases Per 100000 Population"] = per_hunthousand
death_rates = []
for i,j in zip(latest_data["Positive"],latest_data["Fatal"]):
death_rates.append((j/i)*100)
latest_data["Mortality Rates"] = death_rates
latest_data = latest_data.sort_values(by='Positive',ascending=False)
latest_cols = ["Prefecture","Positive","Discharged","Fatal","Hosp_require","Hosp_severe","Cases Per 100000 Population","Mortality Rates"]
latest_data = latest_data[latest_cols]
latest_data = latest_data.rename(columns={"Prefecture":"Prefecture","Positive":"Positive","Discharged":"Cured","Fatal":"Death","Hosp_require":"Active","Hosp_severe":"Severe"
,"Cases Per 100000 Population":"Cases Per 100000 Population","Mortality Rates":"Mortality Rates"})
latest_data.style.background_gradient(cmap='plasma_r')
上記のコードを1つずつ実行していくと、最終的には都道府県別にPositive(感染者数)、Cured(既に完治した人数)、Death(死者数)、Active(治療中の人数)、Severe(重症者数)、Cases per 100000 Population(人口10万人当たりの感染者数)、Mortality Rates(致死率%)の7つのデータが入ったテーブルが出力されます。
累計感染者数が多い都道府県から順に(東京都、大阪府、神奈川県、…)表示されます。
致死率データを都道府県別に棒グラフにしてみると、以下のようになります。
致死率が比較的高い県は、徳島県(3.81%)、福島県(3.36%)、北海道(3.28%)、兵庫県(3.12%)などです。
致死率が比較的低い県は、島根県(0.18%)、鳥取県(0.42%)、沖縄県(0.82%)、宮崎県(0.88%)などです。
大半の県の致死率は1%~2%台でした(東京都:1.29%、大阪府:2.54%、神奈川県:1.42%など)。
致死率の高低の要因を断定することは簡単ではありません。致死率が0.5%以下となっている山陰2県(島根県、鳥取県)は感染者数そのものが少ない(島根県:551人、鳥取県:466人)ため、死者数が抑えられているのではと考えることができます。島根県に至ってはつい最近まで死者0人の状態が続いていました。
ただ感染者数が少ないのにも関わらず、致死率が高めの県もあります。秋田県(致死率:2.57%、感染者数:776人)、福井県(致死率:2.98%、感染者数:1138人)、岩手県(致死率:2.81%、感染者数:1633人)などです。
感染者数が少ない=致死率も低めになるというわけではないようです。新型コロナウイルス感染症の死者は高齢者が多いので、感染者数に占める高齢者の割合が如何ほどなのか、医療機関の逼迫度合いはどれくらいだったのかといった要素も重要になりそうです。
特に感染者数が多い都道府県だけに絞って見てみる
2021年6月23日現在、累計感染者数が10000人を超えている都道府県だけに絞って見てみます。
上図を見ると、感染者数が著しく多い県でも致死率に大きな差があることが分かります。
致死率が特に高い3道府県(北海道、大阪府、兵庫県)は感染者における高齢者の割合が比較的高かった、関西を中心に医療体制が逼迫した状態が長く続いていたことなどが考えられますが、何が要因となっているかは不明です。
今回の記事は以上となります。皆さんも、データを用いて分析やVisualizationに挑戦してみると、面白いのではないでしょうか。
2021年6月21日現在の47都道府県の新型コロナウイルス感染症致死率(%)小数点第3位以下は切り捨て(”COVID-19 dataset in Japan“データセットより作成)
都道府県名 | 致死率(%) |
北海道 | 3.28 |
青森県 | 1.26 |
秋田県 | 2.57 |
岩手県 | 2.81 |
宮城県 | 0.94 |
山形県 | 2.32 |
福島県 | 3.36 |
茨城県 | 1.56 |
栃木県 | 1.19 |
群馬県 | 1.88 |
埼玉県 | 1.81 |
東京都 | 1.29 |
神奈川県 | 1.42 |
千葉県 | 1.78 |
新潟県 | 1.38 |
長野県 | 1.82 |
静岡県 | 1.62 |
山梨県 | 1.00 |
愛知県 | 1.84 |
岐阜県 | 1.95 |
富山県 | 1.83 |
石川県 | 2.91 |
福井県 | 2.98 |
滋賀県 | 1.61 |
三重県 | 2.11 |
奈良県 | 1.54 |
京都府 | 1.42 |
大阪府 | 2.54 |
和歌山県 | 1.80 |
兵庫県 | 3.12 |
鳥取県 | 0.42 |
岡山県 | 1.63 |
島根県 | 0.18 |
広島県 | 1.46 |
山口県 | 2.34 |
香川県 | 1.44 |
徳島県 | 3.81 |
愛媛県 | 2.72 |
高知県 | 1.32 |
福岡県 | 1.45 |
佐賀県 | 0.94 |
大分県 | 1.74 |
長崎県 | 2.21 |
熊本県 | 1.75 |
宮崎県 | 0.88 |
鹿児島県 | 0.98 |
沖縄県 | 0.82 |