統計ひと口メモ(第6話)95%信頼区間をどのように使っていますか?

最近の専門誌では、検定でp値と信頼区間を併記することが要求されることが多くなりました。市販統計ソフトではそれに対応して無条件で併記されますが、研究者は信頼区間をどのような場合に有効利用しているのでしょう? オッズ比にようにp値が表示されない場合は、信頼区間があれば「1」が入っているかどうかを見て有意差を判定できます。でも、p値が表示されていれば、わざわざ信頼区間で確認することはしないのでは? いったい、95%信頼区間って何の役に立つのだろうと思っていませんか?まず、信頼区間の求め方から復習してみましょう。

【母平均の推定と信頼区間】

§1.例題:新規バイオマーカーの血清IL-X濃度(mg/dL)をSDラット10匹で測定した。本施設におけるIL-X値の母平均μの95%信頼区間を知りたい。

本施設で使用しているSDラットにおけるIL-X値の母平均の95%信頼区間は141.0~152.6の間に含まれる。

結論.新バイオマーカーの血清IL―X値は141-153 mg/dlである。

§2.本施設内数値が学会基準値内に入っているか否かを知りたい。

  • 学会基準値は平均値が147.1と報告されている。本施設内平均値=146.8

標準偏差=8.2、95%信頼区間=141.0~152.6であった。学会基準値147.1は95%信頼区間内にある。すなわち、学会基準値と本施設間では有意差がみられない。

結論.本施設の数値は学会基準値内にある。

§3.有意差がみられなかったときの95%信頼区間の使い方

スネデカー・コクラン「統計的方法(第6版)」岩波書店より改変。

  • ある農場では、薬剤散布がトウモロコシの収穫量を増やすならば実施したいと考えている。散布費用は,1000坪あたり50kgの収穫量があれば採算があう。試験畑で薬剤散布と非散布の収穫量の差は120 kgであった。散布による利益の推定値は120 -50 =70kgとなる。薬剤散布畑と非散布畑で収穫量の有意差検定をしたところ有意差がみられなかった。農場主は散布をするかしないかを選択しなければならない。
  • そこで平均利益について95%信頼区間を求めると1000坪あたり-25~160

であった。すなわち,薬剤散布で利益がでない場合は-25㎏とマイナスになるが,うまくいけば160kgの利益がでる。その選択は農場主にまかせられるが,あなたならば散布しますか?

※ 1エーカーを1000坪、1ブッシェルを50㎏として略換算。

※ 95%信頼区間をp値の代わりに使う傾向にある今日ですが,差があるかないかのp値ではなく,実際の選択基準に具体的な数値として求めることができることに留意すべき。

§4.95%信頼区間の扱いに統計家は2つに分かれている

  • 広津氏は「信頼区間については、つい母平均が信頼区間に含まれる確率が95%」といいたくなるが、それは正しくない。あくまで母平均は未知数で、信頼区間あるいは信頼上下限が標本平均の関数として変化する確率変数なので、「信頼区間が母平均を含む確率が95%」と表現しなければいけない。すなわち、実験を繰り返し、α=0.05なら、100回このような信頼区間を構成すれば95回は真値を含む信頼区間となっている。

広津千尋「実例で学ぶデータ科学推論の基礎」岩波書店 2018年

  • ザルツブルク氏も、「信頼区間はそのときそのときの結論ではなく、1つの時間的な仮定と見なすべきものなのである。長期間の試行で、95%信頼区間を毎回計算していけば、母数の真値がその信頼区間のなかにおさまる割合がその試行の95%である。—たいていの科学者は90%から95%の信頼区間を計算し,まるで母数の真値がその区間に含まれていることを確信しているかのようである」。 

D.サルツブルグ著「統計学を拓いた異才たち」日本経済新聞社

  • Norleans氏は平均値がその信頼区間の中にある確率が95%であるということになる。95%の確率は、もし同じ試験を100回繰り返したら、100回のうち95回は平均値が信頼区間の中にあるということを意味するのではないと述べている。

Mark x.Norleans「臨床試験のための統計的方法」サイエンティスト社

※以上のようにNorleans氏は広津氏やザルツブルク氏とは正反対の意見を述べている。それは、頻度論者とベイズ論者の違いで、前者は「同じ試験を100回繰り返したら、平均的に95回は真の平均値が信頼区間の中にある」ことと主張し、後者は「その信頼区間の中に真の平均値が存在する確率が95%である」と主張している。実務家は時に応じて使い分けているのでは?