統計ひと口メモ (第2話)~それでもWelch(ウェルチ)検定やりますか?

名古屋市立大学大学院医学研究科 非常勤講師 薬学博士 松本一彦

§1.Welch検定とは?
■t検定が2群の分散が等しい、すなわち等分散を条件にしているのに対して、分散が異なる不等分散のときに用いる検定です。分散が異なるため、調整した自由度(等価自由度)を用いてt検定をします。
等価自由度(ν*)は下記の式で求めますが“少数自由度”で整数にはなりません。(※少数自由度はエクセルでは求まらない。したがって、エクセル分析ツールにはWelch検定は入っていない)。

第1話では「それでも分散分析やりますか?」を取り上げました。多くの教科書には、 2群間の平均値の差の検定で,不等分散のときにWelch検定をするようにと書かれています。GLPで決定樹に従って解析している施設では、F検定で有意となった場合に、機械的にWelch検定にいくようになっているケースが多いようです。

■t検定とWelch検定では平均値の差の標準誤差(s.e)の求め方が異なります。

■nが等しい場合、等分散を仮定したときと同じt値を示しますが、自由度が小さくなるため,  有意となりにくくなります。ここではt検定のp=0.0054でWelch検定ではp=0.0090と大きくなりました。すなわち、n数がほぼ同じ場合は、t検定で有意となるデータがWelch検定では有意とならないケースがあるということです。

蛇足:差を出したくないようなケースでWelch検定を使うと喜ばしい結果になるので敢えて使う人もいるかもしれませんが、本来、統計手法は差を出したい人向けの手法で、帰無仮説H0をμ1=μ2、対立仮設をμ1≠μ2と置いて、帰無仮説を否定して、対立仮設を採用します。

■不等分散の場合には,しばしば外れ値があり,正規分布とはみなせない場合が多く,ノンパラメトリック検定の対象となります。本試験の場合はWilcoxon順位和検定でp値が0.0080で,Welch検定より小さな値となりました。それだとWelch検定よりWilcoxon順位和検定を使うのでは?

§2.Welch検定はエクセル分析ツールではできません。

エクセルでは少数自由度を求めることができません。したがって、Welch検定という名前で解析することはできません。

§3.Welch検定の出番はないのだろうか?
外れ値があるときには正規分布が疑われるため、ノンパラのWilcoxon順位和検定を用いることが多くなります。n数が等しいときは、t検定と同じ結果になるので、わざわざWelch検定を用いる必要はありません。 そうすると、Welch検定の出る幕はないのでは? いえ、 下記のようなケースでは出番があります。もし、外れ値がなくて、それでも分散に差があってn数が倍ほど違うような例では、t検定やWilcoxon検定より検出力が高い場合があります。次の例を見てください。

<Pharmaco Basicでの解析>

箱ひげ図
外れ値なし
Student’s t検定
有意差なし(p=0.091)
F 検定
F 検定では有意差なし(p=0.057) 
Levene検定
Levene検定で有意差あり(p=0.008)

外れ値がない場合は、偏差の2乗を使うF検定より、偏差の絶対値を使うLevene検定の方が検出力は高いと言われています。

Wilcoxon順位和検定
Welch検定

結果:2群間の差はWelch検定でのみ有意差がみとめられました(p=0.047)。分散の検定では,F検定では有意差はみとめられず,Levene検定でみとめられたのは,外れ値がなかったことが影響していると思われます。それは,Wilcoxon順位和検定で有意差がみとめられなかったことと一致しています(p=0.115)。すなわち、Welch検定の出番は「n数が倍ほど異なり、外れ値がなく、分散が異なるデータ」と言えます。

Pharmacoホームページ:https://pharmaco.club/