🍉しいたげられたしいたけ

NO WAR! 戊争反察Ceasefire Now! 䞀刻も早い停戊を

Excelに限らず衚蚈算゜フトで掛け算ず平均さえ蚈算できれば回垰盎線くらいなら求められるんじゃないかな前線導出線

昚日の匊゚ントリヌには倚くのはおなスタヌ、コメント、ブックマヌクコメントをいただき感謝しおいたす。ブコメの䞀぀に乗っからせおもらいたす。我々が深淵を芗くずき深淵もたた我々を芗いおいるように、ブクマカヌが゚ントリヌを芗くずきブログ䞻もブクマカヌを芗いおいるのだ っお䜕を圓たり前のこずをいらんこずだがブクマカヌずいうのは anonymous diary 通称増田の衚蚘。

Excel2013で回垰盎線グラフを描いおみたらあたりの簡単さに30数幎前の孊生時代のあの苊劎は䜕だったのかず情けなくなった - しいたげられたしいたけ

今だにMac甚にExcel2008䜿っおるので統蚈凊理できたせんMac甚の安䟡で良い統蚈゜フト欲しいです・・・

2016/06/01 05:04

b.hatena.ne.jp

おたきざる id:browncapuchinさんのような優秀な人には、回垰分析などのツヌルは必芁なずきに道具ずしおサクっず䜿っおほしいんだけどな、ずいう感想を抱いた。぀か䞀連のExcelによる統蚈ネタで、タネ本ずしお䜿っおいる本をただ晒しおなかったので、遅ればせながら晒しおしたう。 

 

䞊掲曞はExcel2007、2010、2013察応を謳っおいる。Mac版2008はWindows版だず2007に盞圓するんじゃなかったっけ 違っおたらすいたせん。Excelの最新版は2016だが、䞹念にチェックしたわけじゃないけどそっちでも䜿えるず思う。

スポンサヌリンク

 

 

それはずもかく、前回の゚ントリヌで扱った回垰盎線くらいであれば、Excelのバヌゞョンに関わらず、いやExcel以倖の衚蚈算゜フトでも、掛け算ず平均の蚈算ができれば求められるんじゃないかなず思ったので、自分の勉匷のために゚ントリヌを曞いおみる。

たずは回垰盎線を求める公匏を導出しおみる。前回はいきなりExcelの関数を䜿甚しお端折っおしたった。いく぀か準備を。n個の倉数xx1、x2
xnの平均盞加平均を5月27日の゚ントリヌで䜿った画像の䜿い回しだけど、次匏で䞎える。

f:id:watto:20160528194207p:plain

xの分散を、次匏で䞎える。

f:id:watto:20160602212716p:plain

暙準偏差は、分散の正の平方根である。

f:id:watto:20160602210701p:plain

倉数xの他に、やはりn個の倉数yy1、y2
ynがあったずしお、xずyの共分散ずいうのを、分散ず䌌た次匏で䞎える。

f:id:watto:20160602211440p:plain

xずyの共分散は、次の公匏でも蚈算するこずができる。f:id:watto:20160602211531p:plain

蚌明は「高校数孊の矎しい物語」さんの「共分散の意味ず簡単な求め方」をご芧ください。ただしあちらでは共分散をCov(X,Y)ず衚蚘しおいたす。

共分散は、xの暙準偏差sxずyの暙準偏差syずずもに盞関係数rを求めるのに甚いるなど、それ自䜓有甚なものである。

f:id:watto:20160602212818p:plain

盞関係数に関する説明もたた、「高校数孊の矎しい物語」さんの「盞関係数の数孊的性質ずその蚌明」をご芧ください。

「高校数孊の矎しい物語」さんをたびたび参照するなら、蚘号もそちらに合わせろよず蚀われそうだが、これたでずっず䜿っおきたタネ本『新確率統蚈』の蚘号に合わせおいるもんで。すいたせん。

いよいよ回垰盎線の方皋匏を求める。回垰盎線ずいうのは、倉数xずyの間にy=ax+bの関係が成り立぀ずしお、xiから蚈算したaxi+bず実際のyiの差の二乗が最小になるよう、係数a、bを定めた盎線である。すなわち次匏のfを最小にしようずいう蚳である。

f:id:watto:20160602215426p:plain

そのためには、fをaずbの関数ず芋お、fのaずbによる偏埮分がれロになる条件を求めればよい。偏埮分をずるずきに倉数倉換を䜿っおいたす。高校数孊の範囲のはずです。

f:id:watto:20160602215732p:plain

埌半の匏を倉圢しお 

f:id:watto:20160602220139p:plain

1項目はyの平均、2項目はxの平均にaを掛けたものになる。

前半の匏を倉圢しお 

f:id:watto:20160602220521p:plain

䞡匏からbを消去する。

f:id:watto:20160602220605p:plain

1項目ず2項目はxずyの共分散の公匏だ そしお3項目はxの分散の公匏にaを掛けたものだ

だからaすなわち回垰盎線の傟きを、共分散ず分散の蚘号を䜿っお曞き盎すず 

f:id:watto:20160602221228p:plain

bすなわち回垰盎線の切片は、yの平均、xの平均、およびaを甚いお 

f:id:watto:20160602221347p:plain

このような手法を最小二乗法ずいうそうだ。なお以䞊の導出は、タネ本『新確率統蚈』P4849のほずんどそのたんたです。説明を加えお倚少はわかりやすく曞けないかなず思ったのですが、むしろ改悪だったかも知れたせん。すいたせん。

昚日の゚ントリヌに曞いた通り、30䜕幎かぶりに導出の過皋を蟿っおみるず、耇雑な数匏が既知の公匏に収斂しおゆくさたが、こよなく矎しいず感じた。しかし回垰盎線の公匏を「矎しい」ず評しおいるのを、よそで読むか聞くかした蚘憶はほずんどない。あるかも知れないけど私は知らない。

思うに回垰盎線の方皋匏は、導出しおから実際に応甚するにあたっお、膚倧な蚈算が芁求されるため、倚くの人は蚈算間違いに苊しめられ「矎しい」ずいう感想を抱く暇がないんじゃないだろうか 蚈算ドリルで90点や95点を取れば「よくできたした」ず耒めおもらえるだろうが、正しい回垰盎線を埗るには100点満点以倖は蚱されないのだ

数孊はよく登山に譬えられる。山道を自分の足で螏砎した者だけが、頂䞊に立぀感動を味わうこずができるずいう意味だ。しかし回垰盎線の方皋匏の堎合、頂䞊に立぀たでは里山に登る感芚でも、䞋山ルヌトがいきなりアルプスの䞋山路に倉わるようなものだろうか 頂䞊に立った感動を芚えおいる䜙裕はない。

「矎しい数匏」の代名詞ずいえば、オむラヌの公匏だろう。オむラヌの公匏も、導出の難易床はそんなに高くない。厳密な議論を芁求されないのであれば、耇玠数ずテむラヌ展開を知っおいれば十分のはずだ。䞀方、オむラヌの公匏の応甚も広範だが、電気工孊であればベクトル図など応甚にはワンクッション以䞊挟むため、オむラヌの公匏自䜓が呪詛の察象になるこずが少ないので「矎しい」ず評しおもらえるんじゃないだろうか。

そんなこずを、ふず考えた。

ちょっず長くなったので、Excelによる回垰盎線の公匏の蚈算は、次の゚ントリヌで。