1. トップページ
  2. ビッグデータを読み解く (1) ~時間と空間で見る新型コロナ感染の広がり~
中谷友樹/水野貴之

中谷友樹/水野貴之

東北大学大学院 教授/国立情報学研究所 准教授

中谷友樹/水野貴之

2020年12月

公衆衛生

研究者

取材日:2020年12月 9日

ビッグデータを読み解く (1) ~時間と空間で見る新型コロナ感染の広がり~


 

各地で発生した第1波、大都市に集中した第2波

水野 データの解析って2波ぐらいまでしかやってないんですけど、2波の所で見ると、横軸に人口をとって、縦軸に感染者数をとると、同じぐらいの人口なのに感染している場所と、していない場所って分かれていて。

中谷 特に1波なんかがそうですよね。

水野 それが流されて、人口と比例するような感じに徐々になってきているのかなみたいな。

中谷 1波のほうが最初あちこちに飛んで。人口で見たら、そんなに感染者数が増えてなさそうな所でも、結構飛び火していたんですよね。例えば北陸とかで深刻だったり。2波のほうが大規模な都市のほうに鮮明に固まっている感じがしますね。

水野 鮮明に固まっているのが出てきましたね。

中谷 だから、最初の頃はいろんな所で十分備えができていないうちに、院内感染とかクラスターが発生してしまって、地域で深刻な流行になりやすかったっていうこともあったんだと思うんですよね。

 

20201213_1_1.png

20201213_2_1.png

 

中谷 北海道なんかも、最初いろんな所で発生するんですね、それがしばらくすると、札幌に集中するように見えてくるっていう感じですね。北海道の場合、この辺ですよね。PCR陽性(の数)を平面的に見ると、いろんな所で出ているっていうのが強調されるんですけど、時間で見ていただくと、札幌の辺りに集中していくっていうのが、より鮮明にわかると思いますね。 鹿児島もそうかな、鹿児島もそうだったかもしれません。鹿児島も有名なクラスターがあった。

水野 ありましたね。

 

大都市からの流行に郊外が飲み込まれて感染が持続する

水野 最初のころ、マスクしていないので、いきなり会って感染しちゃうっていう形があるので、いろんな所に飛びやすかったんですけど、(時間軸で)この辺になると確率が低くなるので、何回も何回も接触しないと感染しないので、そうすると、どうしても人の流れっていうのが出やすくなってくるんですよね。

中谷 (感染報告を示す)点の密度でいうと、最初のうちは、郊外とかも早いうちから出るんですよね。早いうちから出るんだけど、最初のうちはそれが持続しないんです。内側から徐々に広がっていくやつに飲み込まれるようになると、結構、連続的に発生するようになるんですね。コロナの場合は、多くの人が新しい感染を生まないんですよね、クラスターで拡大していくっていう特徴があるので。クラスターを起こしやすいのは、どうしても大都市。大都市の中でも、クラスターがつながっていくっていう。そうしないと拡大していかない。単発でちょっと外に飛んでも、クラスターがつながらないので、結果的にはすぐ消えているっていうことが多い。どうしても、平面的にパッと見ると、いろんな所でたくさん(感染報告が)出ているっていう感じになっちゃうんだけども、それが続いているかどうかっていうのが(大事)。

水野 この辺、甲府でしたっけ、ポッて出てパッて消えますからね。

中谷 こういう所も初めのうちに出てもすぐ消えちゃう。今はもうつながっちゃっていますけど、ポッと出ますよね、相模原とかちょっと出て、クラスターとかあるんですけど、いったん消えるんですよね。でも、その後、内側から広がっていくと、それに飲み込まれる形でずっと(感染報告が)出るという感じになります。

 

――中心部とか結構、この辺はすごいですね。

中谷 中心部ね、わかりにくいんです、単に点が重なっちゃっているので。実際にはもっとたくさんあるんですよね。拡大して密度で表現することによって、多いっていうのがわかると思います。

このデータのすごいところは、店舗とか施設単位で見ているので、新宿でも東側と西側のどっちが多いかとか見えるんです。歌舞伎町、歌舞伎町って言うけど、歌舞伎町が特に問題になってくる時期がいつぐらいなのかとか、そういうのも見えてきますね。緊急事態宣言があって、一度消えかかったあとに、そこから再発していくんですけど、そういうのもきれいに見えていますね。

 

――こんなにディテールがきれいに見えるんですね。

中谷 すばらしいですよね、こうやって見えることによって初めてわかることがたくさんあるっていうことですね。しかも、全部、時間の情報を持っているので、時間の推移が追えるのが画期的だと思うんです。

要するに、ある所で発生したものがつながっているかどうかなんですよ。単発で感染が発生しても、それがその地域で根づく、言い方がいいのかわからないですけども、たまたま都心のある人が持って帰って感染しちゃったというだけじゃなくて、その地域で感染が続くかどうかっていうのが、その地域の対策ではすごく大きいですし、その地域で経済活動をしていいかどうかっていう問題も、それが大事なんです。だから、単発での発生ではなくて、感染が連続しているかどうか、それが大事なんですね。

 

20201213_3_1.png

 

家庭内感染数や報告施設数がデータに影響する

中谷 これで見た時に、引っかかることがあるとすれば、3波のほうが患者数が本当は多いわけですね。多いんだけども、(多くの感染報告を示す)赤がそんなに多く見えてないような感じがする。3波のほうが深刻じゃないようにも、一見、見えるんですけど、どうも使っているデータの性質が関係してそうだっていうことですね。

グラフのオレンジのラインは、今使っているJX(通信社)さんの、感染を報告してきた施設の数なんです。単位が、0、50、100とか、こういう数字です。青のほうが、国が整理しているPCR陽性の患者数で、数字でいうと一桁大きい。よく対応しているので、このデータ自身がトレンドを捕まえているっていうことは確かだと思うんです。ただ、オレンジに対して、青が、やや3波で上に来ちゃっているんですよね。PCR陽性の患者数に対して、感染を報告している施設数が3波では少なめに出ているということがあって。

その理由がいくつか考えられると思うんです。1つは、家庭内感染の数が増えているっていう話。家庭内感染が施設の報告では捕まえられないので、その部分で少し少なめになっているということもあるでしょうし。あと、懸念すべき点は、(施設が)感染を報告すると、ひぼう中傷とかを気にしてやめちゃうというようなこともあり得ると思うんです。情報をこうやって出していただくことによって、初めてこういうのが見えてくるというところがあるので、ぜひ頑張って出してほしいなということが1つのメッセージになるのかなと思いました。

 

都道府県単位より下のレベルで実態を把握したい

――こういうデータは普通に公開されているのかなと思ったんですけど。

中谷 これ、全くないですよね。海外でもこういうデータって珍しいんだろうと思うんです。地理情報の世界では、自発的に提供される地理情報っていうカテゴリーがあるんですけど、そういう種類のもので。こういうのって、公的には作りにくい面も確かにあると思います。

日本の場合、難しいのは、PCRの陽性者数、何人っていう統計の数字が、普通、都道府県で公表されますよね。だから、都道府県っていう単位の下でどうなっているかっていうのがなかなかわからないんですね。実際には、医師が診断した結果が必ず保健所に報告されて、保健所では集計を必ずしますので、全国的に保健所単位での感染者数っていうのは、日々、更新されているはずなんです。けれども、その仕組みが残念ながらうまく機能していないか、あるいは、公表するのに何か行政的な判断では難しい面があるんだろうと思うんですね。でも結果的に、今日は神奈川県で何人だったとか、東京で何人だったっていうのが、具体的な実感を伴わないような流行の情報になっているということが、問題だったんじゃないかなと思うんです。

 

――都道府県単位しかデータがないっていうことですか?

中谷 なかったり、あるいは、自治体ごとにしか情報を公開していないので、自治体ごとの情報の公開って、様式がバラバラだったり。ある県は、どこに住まわれているかっていうことを保健所レベルで公開したり、市町村レベルで公開したりするんだけども、場合によっては、いろんな経緯で住所を公開しないっていう場合もあったり。

あと、再利用ですよね、情報が電子的に再利用できるような形で公開されていなくて、例えば紙をスキャンしてアップしている、PDFでアップしていると。そうなっていると、多くの人手を要して必死に読んでいかないとデータができないんですね。でも実際、厚労省の中では、多くの方々がそういう作業をされて、地道に情報を捕まえるという作業をしていましたけども、そういう情報がなかなか外に出しにくかったっていうこともあるとは思うんですね。

水野 あとは、今日の値っていうデータはあるんですけど、昨日の値を上書きしちゃう。

中谷 累積になっていたりとかね。

水野 すごい困るんですよね。こうやって動画にして見てやると、どういうふうに感染が広がっていくのかっていう動きがよく見えるんですけど、それが見えなくなっちゃう。

中谷 そうなんですよね、累積だったり、今日の(だけ)とか、そういう数字になってしまうと、初めから全部追っていないと情報を復元できないし。あと、実は間違えていましたっていうのがあるんですよ。統計情報に不備があって修正しますっていうので、突然、値が跳ね上がったりっていうこともあったりして。われわれとしてみると、さかのぼって、いつからデータが変更されたのかとか知りたいんですけど、そういうのが普通はなかなか公開されない。

 

個人が行動を判断するうえでも詳細な情報公開が必要

――効果的な対策を考えるためにも情報は大切?

中谷 まずは現状を知るっていうことですよね。とても大事なことだと思いますし、基本的なことだと思いますね。そのために情報を必要とするっていうことはもちろんです。

(もう1つは)多くの普通の方々、市民の方々にどういうふうに判断して動いてもらいたいかっていう時に、正確な情報があることが望ましいと思うんです。どれぐらい流行が深刻になっているのかとか、どういう地域で流行が起こっているのかとか、神奈川とか東京っていう数字ではわからないような実態が欲しいと思う人が多かったと思うんです。特に、神奈川県、東京といっても、東側と西側では全然生活圏が違いますし、そういう違いみたいなものが、こういうものだと、県境とか自治体の境を関係なしに見られますから、自分の移動する範囲に合わせて出せますよね。

あと、公的なデータの出し方でよくある問題って、東京は東京だけ出ている。例えば、神奈川県でも、横浜市は横浜市とか、川崎は川崎市とか、それぞれ具体的な情報をホームページにいけば取れるというふうになっていても、自分の生活の範囲がそこにとどまっていないですよね。当然、日常的に県境を越えたり、市の範囲を越えたりして生活している。あるいは自分で非日常的なことを楽しむためにどこかに行く時。自分のふだんの生活から離れて、大都市圏の中の別の自治体に行きたいっていう時に、その状況を簡単に確認できないのは、何かを判断して動くのを難しくしていると思うんですよ。そういう意味では、情報を公開するっていうことは、とても大事だと思いますね。

 

関連番組

NHKスペシャル「新型コロナ“第3波” 危機は乗り切れるのか」(2020年12月13日放送)