統計ひと口メモ (第1話)~それでも分散のF検定やりますか?
名古屋市立大学大学院医学研究科 非常勤講師 薬学博士 松本一彦
統計の教科書には「Studentのt検定をやる前に分散の検定をやって、有意差があったらWelch検定をやる」と書かれています。GLPなどで決定樹を使っている施設では、機械的にF検定をやって、有意差が出たらWelch検定に進む形式になっているところもあります。「Welch検定って何?」それは次回のテーマとして、今回は「分散の検定って何?」をやりましょう。
§1.必要な差の検定は分散ですか?平均値ですか?
2群の差を考えるとき,その“差”とは何を指しているかによって方法が異なります。必ずしも分散の検定をやってからt検定をやる必要はありません。それは次の2つの状況によります。
1)平均値の差だけで,バラツキ(分散)は問題にしていない場合、すなわち等分散を仮定している場合は、「等分散の検定」をやらずに,“t検定”を実施する。
2)平均値の差も,バラツキ(分散)の差も、両方とも問題にしている場合は、
「等分散の検定」で差が認められれば,たとえ,t検定で差が認められなくても,差があると 結論する。 丹後俊郎「医学への統計学」朝倉書店
§2.F検定って?
例題:対照群と薬剤投与群でIL-X値を測定した。両群の分散に差があるといえるだろうか?
F検定は両群の平均平方の比をF比として求め、FDIST関数を使って上側p値を算出する。
下側p値は1-上側p値で求め、その2倍を両側p値として算出する。
結果:p=0.0351で両群の分散に差があるといえる。
※等分散性が棄却されたらWelch検定、棄却されなかったらt検定を用いる場合は有意水準を5%ではなく25%程度にした方がよい1)(吉村功編著 毒性・薬効データの統計解析 サイエンティスト社)。
帰無仮説H0 : σ1=σ2 が成立するとき,それぞれから求められた平均平方の比V2/V1 は
1前後の値を取るであろう。その分布をF 分布という。 F 比を計算するとき,どちらの平均平方を分母に取るかは自由である。現在はF 分布の確率が簡単に計算できるので,F = V2/V1 と固定するのが良いであろう。両側検定のp 値は,上側p 値と下側p 値の内の小さい方の2 倍とする。(芳賀敏郎:医薬品開発のための統計解析 第1部 サイエンティスト社)
§3.F検定よりLevene(レビン)検定がお奨め
Levene検定はOECDの統計ガイドライン2)にとりあげられている他、芳賀敏郎著「医薬品開発のための統計解析 2」に紹介されて広く知られることとなった手法です。
<Levene検定の特徴>
偏差とは“観測値-平均値”, すなわち、バラツキの大きさを示す。
偏差は正負の値を取るので,絶対値に直す.
|偏差|=|観測値ー平均値|=|Xij -―Xi.|
絶対値をつけた偏差を観測値と見なして,「平均値の差のt 検定」をするのがLevene の検定。
<F検定との違い>
F 検定は“平均平方”すなわち“偏差の2 乗の和“を使っているのに対して,Levene の検定は”偏差の絶対値の和“を使っている.もしデータに外れ値が含まれているとき,偏差の2 乗を用いるF 検定はその影響を強く受ける.Levene の検定は外れ値の影響を受け難いという利点がある.
Levene=|Xij -―Xi.|
F = Σ(Xij – Xi.)2
Levene の検定は、3群以上にも対応しており、 F 検定よりも使い道は広い。
§4.分散の検定をPharmaco Basicで解析すると
結果:F検定ではp=0.035で有意差となるが、Levene検定ではP=0.332で有意差とならない。
もし、F検定を5%ではなく25%とすれば、F検定でも有意とはならないが、それでもLevene検定より値は小さい。それは、データに外れ値があることによる。外れ値の確認は箱ひげ図で行う。
Pharmacoホームページ:https://pharmaco.club/
1)永田靖、実験計画法をめぐり諸問題、品質、18:196-204,1988
2)松本一彦、松田眞一、「化学物質試験のためのOECD試験ガイドライン 魚類初期生活段階毒性試験 無影響量(NOEC)決定に向けた統計ガイダンスTG210, ANNEX5」、臨床評価 26:(1)、71-82, 2018