【第14回】マイナスからはじめる生物統計学

多群(3群以上)の解析方法
1.t検定×3はダメ?
ここまでは、主に独立(対応のない)2群および関連(対応のある)2群の比較方法を学んできました。もしも比較する群が3群、4群・・・と増えたらどうしましょうか?例えば3群の比較であれば、A-Bの2群間の比較方法であるt検定や、Mann-WhitneyのU検定を3回やれば良いではないか・・・と考える方もいらっしゃるのではないでしょうか?実は、筆者も統計学を学んで間もない頃は、実際にそのように考えてしまいました。
(別にA-B,B-C,A-C間のt検定を3回やっても良いのでは?)
結論から申しますと、t検定を3回繰り返すのは好ましくありません。何故?ならばここで、今一度統計的検定の原理を考えてみましょう。帰無仮説(比較しようとしている母集団の平均値や割合は等しい)が正しいという前提において求められたp値が、あらかじめ定められた有意水準(この分野ではほぼ0.05)の値を下まわったときには、問答無用で帰無仮説は間違っていた(=0.05未満の確率の出来事などそうそう発生するものではない)と判定しなければなりませんでした。0.05未満の希な確率の出来事が発生したとは「考えてはならない」のが、統計的検定の掟なのですが、もしかしたら「0.05未満の確率の出来事が起きているかもしれない」ことは、全数調査を行わない限りは証明出来ません。もちろん、医学研究の母集団は「生物学的ヒト(無限母集団)」ですので、全数調査は不可能です。検定1回あたり0.05(5%)までは、過ち(第一種の過誤:αエラー)を犯してしまっても仕方が無いということになるわけですが、その過ちを確認する方法はございません。検定1回当たり5%、ということは、もしも上記のように3回繰り返した場合、1-(1-0.05)3=0.1426、つまり14.3%の確率まで過ちを許容してしまうことになります。仮にA~Eの5つの群があった場合、総当たりで検定を10回繰り返した場合には、1-(1-0.05)10=0.597・・・つまり、本当はどの母集団同士にも差が無くても、60%程度の確率で有意差アリとされてしまう可能性があることになります。5群間の総当たりで比較を行った場合、5C2=10回の比較が必要になります。これでどこかの群間、時点間で有意差がありましたと言われても、残念ながらそれほど説得力を持つものではございません。何も無くても6割の確率で有意です・・・と言われましても・・・どうですかね?
2.分散分析(まとめて多群を比較する)
というわけで、群が増えても検定を繰り返してはならない・・・ってことになりますと、どうすれば?そこで、分散(=バラツキ)に着目する方法が「分散分析(Analysis of Variance:ANOVA)」です。要因1)が1つの場合は「一元配置分散分析(One-way ANOVA)」、2つの場合は「二元配置分散分析(Two-way ANOVA)」と呼ばれますが、ここでは基本的な一元配置について解説します。
コメント
/
/
/
コメント