コロナで学ぶエクセル 4 米国のデータから

1.米国各州のデータを入手する

 世界のコロナ関係のデータとして,メディアでもよく使われているJohns Hopkins大学のダッシュボードのデータを利用して,今,もっとも感染者が多い米国のデータを見てみましょう.

 まず,データを入手します.下の中央の部分を少しスクロールするとデータサイト”Git Hub Here“へのリンクがあります.このサイトの4つの点がある丸いアイコンを押すと下のブロックが広がるので,わかりにくければ拡大してからアクセスしてください.

 下図のページの中段右にあるClone or downloadを押すとDownload Zipというボタンがあるのでそれをクリックします.ダウンロードしたらZIPファイルなのでダブルクリックして解凍します.

 解凍すると”archived data” “case_covid_19_data” “who_covid_19_situation_reports”の3つのフォルダが出てくるので,”case_covid_19_data” を開きます.
 この中にある”case_covid_19_daily_reports_us“にアメリカの州別のデータが入っていますので,最新データを開きましょう.(今回は”04-21-2020.csv“が最新)

2.フィルターでデータを並べ替え

 そうすると左端に州名がずらっと並んだデータが出てきましたね.感染者数の上位から順に並べなおしたいので,1行目のどこかのセルを押してからデータフィルターでフィルターを有効にします.そうすると1行目の各項目に▽マークが付きました.confirmedのところの▽を押して,降順を選択します.

 これで,下図のようにニューヨーク州をトップに感染者が多い順に並びましたね.このように,フィルターで順番を替えられるというのは便利ですね.

3.感染者数と死亡率を同時にグラフ化する

 この表の少し右にMortality_Rate(死亡率)という項目があります.感染者上位のいくつかの州の感染者数と死亡率をグラフで整理してみましょう.感染者が1万人をこえているColoradoまでの表を別のタブにコピーして新しく作ります.

 対象部分をすべて選択し,挿入折れ線グラフ とすると下図のようになります.

 まず,Confirmedの値を棒グラフにします.
水色のグラフ部分をクリックしてアクティブにして,右クリックして「系列グラフの種類の変更」を選択して,棒グラフにします.

 次に,死亡率の赤い線をアクティブにして,今度は「データ系列の書式設定」を開きます.

 そうして,系列のオプション第2軸を選択します.以上で感染者は棒グラフ,死亡率は折れ線グラフができましたね.

 完成したグラフは下図です.

 こうして見ると,Michigan州やConneticut州の死亡率が高いのですが,これについては,検査母数が少なすぎるのではないか(すなわち死亡率の分母である感染者数はもっと多いのではないか)という指摘もあるようです.(たとえば”Michigan has highest U.S. coronavirus death rate, ranks low in testing“)これについては今後の研究を待ちたいと思います.

4.地図とデータを見る

 ダウンロードしたデータの中に,Lat と Long という文字が最初にあります.これはLatitude(緯度)とLongitude(経度)のことです.GIS化するために必要な情報です.ニューヨーク州のところにあるこの数字をコンマでつなげて,42.1657,-74.9481 をGoogle Earthの検索欄に入れてみましょう.そうすると驚いたことにまったくの山の中(Delaware Countyの山中)になりました.これがニューヨーク州の中心付近のポイントだからです.ニューヨーク州には62のカウンティがあります.私たちがよく知っているニューヨーク市はニューヨーク州の南東の端です.
 ダウンロードしたデータにTime Series Confirmed USというデータがあるので開くと毎日のカウンティごとのデータが出てきます.それをまずNew York州でフィルターにかけ,次に最終日(ここでは4月21日)の感染者数で降順に並べます.感染者数1000人以上のリストが下図です.(この統計ではニューヨーク市はカウンティと同格に扱われています)

 ニューヨーク州のCountyの図を示します.上表のCountyには赤い印を付けました.

wikipedia

  今回作業したエクセルを下記からダウンロードできます.

https://bosailiteracy.org/wp-content/uploads/2020/04/hopkins0421.xlsx

 以上,新型コロナを素材にエクセルでグラフを作ったり,感染状況を分析したりしてきました.今回の学びをもとに,これからは自分でさまざまな研究をしていってください.新型コロナに負けず,みんなの力で克服しましょう.

 → 新型コロナのデータを見る

 →コロナで学ぶエクセル 1 累計のグラフを作る

 →コロナで学ぶエクセル 2 簡単な関数と7日平均グラフ

 →コロナで学ぶエクセル 3 世界のデータを見る

 →コロナで学ぶエクセル 5 年代と性別で集計

 → コロナで学ぶエクセル6 実効再生産数Rtの計算

 

 

 

 

 

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です