統計一口メモ 第14話】 <2つの t検定、使い分けていますか?>
名古屋市立大学大学院医学研究科 非常勤講師 薬学博士 松本一彦
「10人の健常男性にエストロゲンを投与し、血中NO濃度を測定したところ薬剤効果は見られなかった。
検定にはt検定(両側)を用いた。(Mebio vol.21より引用一部改変)
この解析法を見て、何も疑問を持たない方は、これからの話に耳を傾けてください。
- t検定には”対応のないt検定(unpaired)“と“対応のあるt検定(paired)”があります。
- “対応のないt検定”は”スチューデントのt検定(Student‘s t test)“とも呼ばれます。
- ただ “t検定”と書かれているときは、一般的には「対応のないt検定」を指します。
- t検定については、「統計一口メモ 第10話」でもとりあげましたが、ここではエクセルで解析してみましょう。
§1.対応のないt検定
t検定の目的は「平均値の差」が「誤差」の何倍あるかを知ることで、まず、t統計量を下記の式から計算します。
次の例で計算してみましょう(仮想例題)。
<投与前 vs投与後>
平均値の差=70.0-47.7=22.3
平均値の差の標準誤差=
√(1/10+1/10)x (4920.10+5734.00)/ (9 + 9) = √118.4
t =22.3/√118.4=2.05 p=TDIS(ABS(2.05,18,2)=0.055(両側)
結果:投与後の方が高値を示したが、両群間には差はみられなかった(p=0.055)。
患者番号は1から10になっています、でも”投与前“、”投与後“のn数はそれぞれ10例となっています。すなわち、患者数は20例です。この場合は、”投与前と”投与後“は患者が異なります。このような標本を“独立標本”と呼びます1)。この場合は群間でn数が異なってもOKです。
※ボクのつぶやき:“患者番号”に惑わされないようにせねば。患者ID とは異なり単に順番をつけているだけなんだ。
§2.対応のあるt検定
平均値の差=70.0-47.7=22.3
平均値の差の標準誤差=
√1/10 x (7072.1/9) = √78.58
t=22.3/√78.58=2.516
p=TDIS(ABS(2.516,9,2)=0.033
結果:投与後の方が高値を示し、両群間に有意差が見られた(p=0.033)。
対応のある場合はn数は患者番号と同じで投与前と投与後が対になっていて、その差が測定値になります。もし、n数が異なるようならば“対応のあるt検定”は使えません。
D.G.Altmanは「“対応のあるt検定”の長所は個体内の差だけに注目することで個体間の変動を除けることである。個体内の差を1標本として扱うので、それらの差はほぼ正規分布している必要があるが、データの各セットそれぞれが正規分布している必要はない」と述べています2)。
§3.“対応のないt検定”と“対応のあるt検定”の違い
①対応のない場合は、下図ではn数が55例と49例のように違いがあってもOKです。
そして群ごとに独立して表示されます。
②対応のある場合は、個体を線で結んだ図で表示します。当然n数は個体数(同数)で、“対応のない場合”の半分です。1
§4.n数が多い場合の表示
下の図は「重症心不全に対する温熱療法前後の血行動態の急性変化」の論文に載っていたものです。両群ともn数が多い場合には、個別値を結ぶと煩雑になるために平均値を結んで“対応のある検定”であることを示しています。
§5.こんな表示法も
§6.薬理論文で用いられている数の比較3)
データとしては、少し古いのですが、日本薬理学会誌で用いられている統計手法のうち、半数が t検定で、その中でも”対応のないt検定“が”対応のあるt検定“の4~6倍多く使用されていました。
§7.Pharmaco Basicでの解析(https://pharmaco.club/)
Pharmaco入力形式
“対応のあるt検定”の場合は「群名」を必要とします。
Pharmaco Basicのアウトプット
“対応のあるt検定“は図のように、個体間を線で結ぶことで、”対応のないt検定“と見分けることができます。
1)スネデカー・コクラン「統計的方法」第6版 岩波書店 1977年
2)D.G.Altman [医学研究における実用統計学]サイエンティスト社 1999年
3)浜田知久馬「新版 学会・論文発表のための統計学」真興交易((株)医書出版部 2016年