統計一口メモ 第8話 【Fisher正確検定は片側?それとも両側?】
A君の質問です。「学会誌に論文を投稿したら、査読者(レフリー)から「セル内に5以下の数値があるのでχ2検定ではなく、Fisher正確検定で求めよ」と言われました。実施したχ2検定は両側検定なのでFisher正確検定も両側検定をしようと思っているのですが、教科書1)には片側検定
しか出ていませんが、JMPのアウトプットでは片側と両側が出ています。でも、両側は片側の2倍ではありません、どうしてなんでしょうか?」という内容でした。
R.A.Fisherの正確検定は本来片側検定として提案されたものですが、両側検定だと思い込んでいる人も少なからずおられます。その両側検定の求め方が統計家(統計ソフト)によって異なるので
要注意です。そもそも「Fisher正確検定って何?」から紐解いていきましょう。
<目的>2x2分割表で4つのマス目(セル)内に5以下の数値がある場合に、2群間の出現率に差があるかどうかを検出する。
<定義>4つのセル内の数値で求められる確率は、次の式で定義される。
nCgはn個からg個を選ぶ組み合わせ(Combination)の数で
として求められ、2項係数と呼ばれます。ちなみにExcelではn!は=FACT(n)で、2項係数nCgは
=COMBIN(n, g)で求めることができます。
上の投稿論文の例で解析してみましょう。
手順1.Cisplatin投与群15例から有効4例の取り出し方は15C4=1365通り
Ascle投与群10例から有効7例の取り出し方は10C7=120通り
Cisplatin投与15例から4例、Ascle10例から7例の取り出し方は、15C4 x 10C7=
1365 x 120=163800通りある。
手順2.全体の人数25例から有効症例 4+7=11例の取り出し方は25C11=4457400通りある。
手順3.2x2分割表の生起確率pは
手順4.分割表でセル内の最小値がゼロになるまでの確率を求め、それを合計する。
片側検定でp値は0.0416となる。
<JMPでの両側確率の求め方>
JMPでは、両側検定を反対側にゼロになるセルを作成して片側で求めたP値に加えます。
両側検定のp値は片側検定のp値0.0416より小さい累積p値(0.0070)を足した0.0070 + 0.0416 =0.0486となります。なお、0.0575は0.0416より大きいので、より小さな0.0070が採用されます。
JMPでは次のように表示されます。
<もう一つの両側検定>
丹後俊郎氏は次のように述べています2)。「両側検定の場合のp値の計算方法はいくつか考えられているが、推奨する方法は“片側p値を単純に2倍”することである」。
また、竹森幸一氏は論文の中で「片側確率はいずれの解説書でも同じであるが,両側確率は次の2つの型にわかれる」と述べています3)。
1.片側確率に観察パターンの起こる確率と同等あるいはそれより小さい確率を全て加えた場合
2.片側確率を2倍したもの。
この1の方法はJMPの方法で,2.は前述の丹後氏が述べている方法、Pharmacoの方法です。
<JMPとPharmacoの両側確率の求め方の違い>
JMPの両側確率の求め方は、左の例では片側=両側で、真中の例では片側確率+αで
右の例では片側x2倍となり、データによって求め方が異なり、一定の方式をとっていません。
したがって、Pharmacoは両側=片側x2倍方式を採用しています。なお、右の例は有効と無効の合計が5で等しくなっています。そのようなケースでは、JMPもPharmacoも結果は同じになります。
統計一口メモ第7話の2x2分割表のχ2検定もイエーツの補正をするソフトとしないソフトがあり、結論が異なることを述べました。また、今回もFisher正確検定で両側確率を求める場合はソフトによって結論が異なることがあることにふれました。使用しているソフトがどちらを選択しているのか知っておく必要がありますね。なお、Fisher正確検定はFisherの直接確率検定とも呼ばれています。
<文献>
1)吉村功編著「毒性・薬効データの統計解析」サイエンティスト社(2005年)
2)丹後俊郎「医学への統計学」第3版 朝倉書店(2013年)
3)竹森幸一「わが国の統計解説書にみられるFisherの直接確率法の両側確率と片側確率をめぐる混乱」弘前医療福祉大学紀要 5(1), 77-81, 2014