当サイトについて知りたい方はこちら

【データ視覚化】新型コロナウイルス感染症の致死率を都道府県別に比較

2020年から流行が続いている新型コロナウイルス感染症(COVID-19)ですが、今回はKaggleに投稿されているデータを用いて、コロナウイルスの致死率を都道府県別に比較します。

今回使わせていただくデータは、Kaggleに投稿されているDatasets”COVID-19 dataset in Japan“(本記事では2021年6月21日現在のデータを使用)です。

では、早速KaggleのNotebookを使ってデータを開いてみます。

(データの仕様が変更となった場合、下記コードをそのまま実行しても上手く動作しないことが考えられます。データについて詳しく知りたい場合は、データ作成者の方が書かれたNotebookをご覧になることをお勧めいたします。)

import os
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))
import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
jp_prefecture = pd.read_csv('../input/covid19-dataset-in-japan/covid_jpn_prefecture.csv')
total = pd.read_csv('../input/covid19-dataset-in-japan/covid_jpn_total.csv')
metadata = pd.read_csv('../input/covid19-dataset-in-japan/covid_jpn_metadata.csv')
latest_data = jp_prefecture.tail(47)

per_hunthousand = []
for i,j in zip(latest_data["Positive"],metadata["Value"]):
    per_hunthousand.append((i/int(j))*100)
latest_data["Cases Per 100000 Population"] = per_hunthousand

death_rates = []
for i,j in zip(latest_data["Positive"],latest_data["Fatal"]):
    death_rates.append((j/i)*100)
latest_data["Mortality Rates"] = death_rates

latest_data = latest_data.sort_values(by='Positive',ascending=False)
latest_cols = ["Prefecture","Positive","Discharged","Fatal","Hosp_require","Hosp_severe","Cases Per 100000 Population","Mortality Rates"]
latest_data = latest_data[latest_cols]
latest_data = latest_data.rename(columns={"Prefecture":"Prefecture","Positive":"Positive","Discharged":"Cured","Fatal":"Death","Hosp_require":"Active","Hosp_severe":"Severe"
                                          ,"Cases Per 100000 Population":"Cases Per 100000 Population","Mortality Rates":"Mortality Rates"})
latest_data.style.background_gradient(cmap='plasma_r')

上記のコードを1つずつ実行していくと、最終的には都道府県別にPositive(感染者数)、Cured(既に完治した人数)、Death(死者数)、Active(治療中の人数)、Severe(重症者数)、Cases per 100000 Population(人口10万人当たりの感染者数)、Mortality Rates(致死率%)の7つのデータが入ったテーブルが出力されます。

累計感染者数が多い都道府県から順に(東京都、大阪府、神奈川県、…)表示されます。

致死率データを都道府県別に棒グラフにしてみると、以下のようになります。

棒グラフで表示

致死率が比較的高い県は、徳島県(3.81%)、福島県(3.36%)、北海道(3.28%)、兵庫県(3.12%)などです。

致死率が比較的低い県は、島根県(0.18%)、鳥取県(0.42%)、沖縄県(0.82%)、宮崎県(0.88%)などです。

大半の県の致死率は1%~2%台でした(東京都:1.29%、大阪府:2.54%、神奈川県:1.42%など)。

致死率の高低の要因を断定することは簡単ではありません。致死率が0.5%以下となっている山陰2県(島根県、鳥取県)は感染者数そのものが少ない(島根県:551人、鳥取県:466人)ため、死者数が抑えられているのではと考えることができます。島根県に至ってはつい最近まで死者0人の状態が続いていました。

ただ感染者数が少ないのにも関わらず、致死率が高めの県もあります。秋田県(致死率:2.57%、感染者数:776人)、福井県(致死率:2.98%、感染者数:1138人)、岩手県(致死率:2.81%、感染者数:1633人)などです。

感染者数が少ない=致死率も低めになるというわけではないようです。新型コロナウイルス感染症の死者は高齢者が多いので、感染者数に占める高齢者の割合が如何ほどなのか、医療機関の逼迫度合いはどれくらいだったのかといった要素も重要になりそうです。

特に感染者数が多い都道府県だけに絞って見てみる

2021年6月23日現在、累計感染者数が10000人を超えている都道府県だけに絞って見てみます。

累計感染者数が1万を超えている都道府県のみのデータ(致死率が高い県から)

上図を見ると、感染者数が著しく多い県でも致死率に大きな差があることが分かります。

致死率が特に高い3道府県(北海道、大阪府、兵庫県)は感染者における高齢者の割合が比較的高かった、関西を中心に医療体制が逼迫した状態が長く続いていたことなどが考えられますが、何が要因となっているかは不明です。

今回の記事は以上となります。皆さんも、データを用いて分析やVisualizationに挑戦してみると、面白いのではないでしょうか。

2021年6月21日現在の47都道府県の新型コロナウイルス感染症致死率(%)小数点第3位以下は切り捨て(”COVID-19 dataset in Japan“データセットより作成)

都道府県名致死率(%)
北海道3.28
青森県1.26
秋田県2.57
岩手県2.81
宮城県0.94
山形県2.32
福島県3.36
茨城県1.56
栃木県1.19
群馬県1.88
埼玉県1.81
東京都1.29
神奈川県1.42
千葉県1.78
新潟県1.38
長野県1.82
静岡県1.62
山梨県1.00
愛知県1.84
岐阜県1.95
富山県1.83
石川県2.91
福井県2.98
滋賀県1.61
三重県2.11
奈良県1.54
京都府1.42
大阪府2.54
和歌山県1.80
兵庫県3.12
鳥取県0.42
岡山県1.63
島根県0.18
広島県1.46
山口県2.34
香川県1.44
徳島県3.81
愛媛県2.72
高知県1.32
福岡県1.45
佐賀県0.94
大分県1.74
長崎県2.21
熊本県1.75
宮崎県0.88
鹿児島県0.98
沖縄県0.82
タイトルとURLをコピーしました