SNSには、いちいち反応していたらキリがないくらい大量の情報が流れてくるが、1月中頃のわがツイッタータイムライン中に、なんだか気になるツイートがあった。
サルベージを試みたが、おそらく元ツイが削除されたのであろう叶わなかったので、概略のみ記す。
お医者さんで推理作家で斯界では有名なアルファツイッタラーさんがいて、常々反ワクチン派とおぼしき人々と果敢に対話を試みておられる。
このときは「ワクチンにメリットがあるなら数値を示せばいいじゃないか」と食ってかかったツイッタラー相手に、「はい、どうぞ」というこの方の決まり文句(?)とともに次のデータを示された。ツイートではなく引用元の記事を貼る。
一部、引用。65歳以上のデータである。
感染者のうち、ワクチンの接種回数を詳しく把握できたのは約半数の七万七千四百三十三人、うち死亡者は四百二十五人。このうち接種歴なしの死亡率は1・42%、一回は1・27%、二回は0・97%、三回は0・55%、四回は0・33%、五回は0・21%だった
この数字を見た別のツイッタラーが、
接種なしの死亡率…1.42%
接種ありの死亡率…1.27+0.97+0.55+0.33+0.21=3.33%
よって
接種歴なしの死亡率 < 接種歴ありの死亡率
という結論を下したのだった!
繰り返すが、元リプのサルベージに失敗したのでうろ覚えの記憶に頼って再現している。
本気なのかネタなのか判断に苦しむところだが、このリプはけっこうバズったように記憶している。
ツイッター界のことで「教育の失敗」といったたぐいの罵倒でしかないリプが多かったが、「きちんと反論しようと思ったら大変」「塾講師をやっていると理解していない生徒の方が多数派」というリプも数少ないが目にした。
なにはともあれ元データに当たらねばと、さらに検索した。
神奈川県HPは難なく見つかった。
東京新聞の記事が参照している箇所のデータを抜き出す。
1行目は接種回数。2行目は接種者の総数、3行目は死亡報告の件数、4行目は3行目÷2行目である。
0 | 1 | 2 | 3 | 4 | 5 |
7,942 | 236 | 3,090 | 29,498 | 34,252 | 2,415 |
113 | 3 | 30 | 162 | 112 | 5 |
1.42% | 1.27% | 0.97% | 0.55% | 0.33% | 0.21% |
ただし神奈川県の元サイトには接種者の総数ではなく死亡報告なしの件数と死亡報告ありの件数が掲載されていたが、上掲テーブルには両者の和による接種者総数を載せた。
なんでそのようにデータを加工したかというと、ワクチン接種歴ありとなしの死亡率を計算するには、そのほうが便利だったからだ。
すなわち、
接種なしの死亡率…113÷7,942≒0.0142=1.42%
接種ありの死亡率…(3+30+162+112+5)÷(236+3,090+29,498+34,252+2,415)=312÷69,491≒0.0045=0.45%
よって
接種歴なしの死亡率>接種歴ありの死亡率
がデータ的に示された。
間違ってないよね?(誰に訊く?
だがそれをリプ主にぶつけたとしても、どうなるというのだろう? リプ主が本当にわかっていなかったとしたら、この数字を見せてもわかってもらえるとは限らない。SNSでよくある「わかってやっている」「気の利いたふうの返しをしたら勝ち」「俺さまを説得してみせろ」だったとしたら、対話を試みること自体が徒労であろう。
あくまで個人的な事情であるが、むしろ上掲の神奈川県のデータを見たとき、これ確率統計のサンプルデータとして恰好じゃないかと思った。
データ件数が少なくて扱いやすいし、とてもきれいな相関を示しているから、初心者向けの説明用にうってつけではなかろうか。
Excelに読み込んで、散布図を描かせるであるとか。
スクリーンショットのバージョンはWindows10+Excel2016です。
グラフをクリックで選択すると「グラフ要素」などオプションボタンが表示される。
軸ラベルと近似曲線を追加してみた。曲線と言いつつ最小2乗法による直線近似だが。
より詳しくは「>」をクリックしてサブメニューから「その他のオプション…」を選択すると、作業ウィンドウが表示されるので…
「□グラフに数式を表示する(E)」と「□グラフにR-2乗値を表示する(R)」のチェックも入れてみた。
y=-0.0027x + 0.0146 という数式と、R^2=0.9745という数値が表示された。
表示された数式はSLOPE関数とINTERCEPT関数で計算した値と一致していた。SLOPEは最小2乗法に基づく傾きを計算する関数、INTERCEPTは同じく切片を計算する関数である。
ワクチンのメリットを言いたいのであれば、このグラフを示したら説得力あるんじゃないだろうか?
回帰分析、最小2乗法に関しては、過去何度かネタにしたことがあった。電卓しかなかった学生時代にはその煩雑さが憎悪の対象、Excelを手にしてからは一転、偏愛の対象になっているツールである。
R-2乗値というのは近似曲線から予測される値がどの程度正確かを示す指数だそうで、0以上1以下の値を取り1に近いほど正確だそうだ。とすると表示された約0.97というのは、相当いい数値のようである。
ExcelではRSQ関数で計算できるとのことだった。やってみたら、確かに表示された値と一致していた。
ブログカードを貼るのは自分の備忘用である。
ちなみに回帰直線はLINEST関数というのを使っても計算できることを、今回あれこれ検索していて初めて知った。ただし結果を配列で返すので、その分だけ使いにくそうだ。これも自分の備忘用にブログカードを。
以下、ネタ気味なんだけど、この近似式を使って6回目のワクチン接種を行ったときに予想される死亡率を計算してみた。
-0.0027x + 0.0146
にx = 6を代入して…
-0.0027×6 + 0.0146 = -0.0016=-0.16%
えっ、死亡率マイナス!?
マイナスの死亡率って、どういうこと? 6回打ったら生き返るんかいっ!?
一次近似で係数がマイナスだから、いつか負の値が出るのは当たり前と言うべきか、どこかで限界はあるとしか言いようがないのだけど、さきの平均値を足し算で計算した間違いと、本質的にどう違いがあるか説明できるかというと、はたと困る。
もし反ワクチン派の人にグラフを見せて「6回打ったらマイナスだ」と返しを食らったら、どうしよう?
ということで、私は反ワクチン派ではない。5回目の接種通知は去年の10月頃に届いていた。これまで接種した4回のワクチンはオミクロン株未対応だったので打たなければと思ってはいたが、副反応キツいことを最大の理由に先延ばししていた。少なくとも年に何度もないメイン業務の繁忙期が過ぎるまでは待機しようと思っていた。
4回目のワクチン接種時の過去拙記事はこちら。約半年前か。芋づる式に過去記事をたどると3回目はほぼ1年前だった。だいたい半年に1度のペースで接種していたようだ。
その今期分のメイン業務が、まだ終わりじゃないけどだいたい先が見えてきたので、そろそろ検討しようと思った。
去年の11月24日付過去記事から、ワクチン接種通知書のスキャン画像を再掲。
届いてからすでに何ヶ月も経過していたから、まだ有効かちょっと心配だったけど、内封してあった書類に記載されていたURLにアクセスしたところ、あっさり予約が取れた。
しかもアクセスしたのは先週半ばだったのに、週末の予約が取れた! こんなに早く予約が取れたことは記憶にない。何ヶ月も寝かせておいたのがよかったかな?
前振りの死亡率の話が無駄に長くなり過ぎたので、ここまでを前編とし、接種自体とその副反応の話は後編とします。
スポンサーリンク