統計ひと口メモ(第3話)「t検定の繰り返しはダメ、多重比較をせよと言われた!」

名古屋市立大学大学院医学研究科 非常勤講師 薬学博士 松本一彦

A氏が学会誌に投稿したときのレフリーコメントは、「t検定の繰り返しをしている。多重比較検定でやり直すように」でした。そのデータを示します。

t 検定は2群間比較なので、対照群と10mg群、対照群と30mg群、対照群と100mg群の3回を繰り返しています。このようなt検定の繰り返しは、有意水準を5%でやっているつもりが14%にもなっているので、本当は有意でないのに 有意と出てしまいます。そこで、レフリーは「多重性の調整をして14%を5%にしなさい」というコメントをつけることになります。なぜ、5%が14%になるのかはいつかお話することにして。今回は、レフリーの言う多重比較って何?t検定の代わりに何をすればいいのだろうか?を解説します。

多重比較には大きく分けて3つのタイプがあります。1つ目は「Dunnett(ダネット)型」で、必ず対照群と比較します。群構成は「薬剤名」や「疾患名」のような名義尺度になります。群を入れ替えても構いません2つ目は「Williams(ウィリアムズ)型」でDunnett検定とは異なり、群は用量になっています。なお、データは単調増加・減少を示していることが条件になっています。したがって、群の入れ替えはできません。 3つ目は「Tukey(チューキー)型」で全群間において総当たりするような検定法です。Tukey検定の他にBonferroni検定とHolm検定があります。今回はDunnett検定とWilliams検定をとりあげます。

A氏は、レフリーのコメントに応えて、市販ソフトでDunnett検定を実施したところ、t検定での有意差がみられなくなりました。

なぜ、Dunnett検定では有意差がみられなくなったのだろうか?それには、Dunnett検定って何をやっているのかを知る必要があります。

Dunnett検定とは1つの対照群と2つ以上の処理群があって,対照群と処理群の対比較を全群で同時に検定する方法です。同時にという意味は、2群のt検定と違って複数の処理群の分散を一緒にすることです。対比較とは、対照群とそれぞれの処理群の平均値の差を意味します。

Dunnett検定は、本来、次の例のような場合に用います。

対照群を固定して各群との平均値の差を求めます。この場合の群には用量が無く群間を入れ替えても同じ結果になります。

多重比較と2群比較の違いは分母にくる分散の求め方の違いです。

t検定では、分母の分散は2群だけですが、 

多重比較では分散が全群の合計VEとなります。

従って、分子はt検定と同じ値ですが、分母が大きくなって、t値は小さくなります。検定はt表ではなくDunnett表を使います(実際にはソフトが計算してくれます)。今回のデータでは全群で有意差がみられなくなりました。

A氏はこのまま投稿を諦めなくてはならないのでしょうか? もう少し、他の多重比較についても検討してみましょう。

Williams検定はDunnett検定とは異なり群構成は用量になっています。また、データが単調増加・減少を示していることが条件になっています。さらに、高用量群から検定をしていく下降手順となっていて、有意差がなくなった時点で、その下の用量の検定は行いません。例えば、

このような群構成で100mgで有意差があり、30mgでは有意差がなくなった場合は、その下の10mgは検定せずに、保留(すなわち有意差なし)とします。もし、30mgの方が100mgより高値(低値)の場合は、両群の平均値を使います(調整平均)。なお、単調増加・減少ということから片側検定となります。検定にはDunnett表ではなくWilliams表を使います(実際にはソフトで計算します)。

A氏のデータをPharmaco BasicのWilliams検定で実施してみましょう。

Williams検定ではt検定と同じ結果が得られました。A氏のデータは用量があり、単調減少していることから検定はWilliams検定を用いるべきでしょう. A氏は無事論文審査を通りました。

なお、JMP、SPSS, PrismソフトはWilliams検定を搭載していません。 Williams検定を搭載しているソフトは少ない状況です。

Tukey、Bonferroni, Holm検定は、後日とりあげることにします。