統計一口メモ 第11話 「今さら「標準偏差」と「標準誤差」だけど」
「統計学って一晩たつと忘れる学問だと思う」と言ったのは誰だったか。
論文でMean±SEだろうがMean±SDだろうか気にとめる人は少ない。どっちでもいいと思っている人がほとんど。ホントはどっちでもよくないんだけど。後輩から「先輩、SDとSEの違いって何ですか?」と聞かれたら、「うーん、わかんない!」と答えるのも悔しい。そこで、標準偏差Standard deviation SDと標準誤差Standard Error SEについて復習して、しっかり答えられるようにしておきましょう。
問1.表に書くときにSDを使いますかSEを使いますか?
問2.SDとSEが載っている図に描かれているバーは何を意味しているのでしょう。
§1.バラツキの大きさを知りたい
n個の観測値 x1,x2,…,xnがあります。とりあえず5個とします。
186 168 156 188 187
この平均値は177です。観測値と平均値の差
を偏差と呼びます。
この偏差を足せば、バラツキの数値になるのでは?
でも、(観測値- 平均値)の総和を求めてもゼロになってしまう。偏差の和はゼロなのです。
=(168-177)+(156-177)+(188-177)+(187-177)+(186-177)=0
そこで、2乗することでマイナスをプラスにしてみます。
S を偏差平方和,または略して平方和 (Sum of Squares)と呼びます.
ただし,この式だと、データの個数が大きくなるにつれてバラツキが大きくなってしまいます。個数の大小にかかわらず、バラツキを求めたい。
そこで、総和をデータの個数で割ることにします。
統計数理の世界では個数の代わりに個数から1を引いた 自由度ν(ニュー)=n-1を用います。n数が100例もあればnだろうがn-1だろうか関係ないのですが、基礎研究の段階ではnは10例以下のこともあります。n-1は大事になってきます。
平方和 Sを自由度で割る.
Vを平均平方、不偏分散、分散と呼びます。
平方和と平均平方の単位は観測値の2乗なので扱いにくいため平方根をとります。
これを標準偏差といいます。バラツキを表すもっとも標準的な数値です。
§2.それでは、標準誤差とは何でしょう? 標準偏差とどう違うのでしょう?
「標準誤差って何?」と聞かれたら、「n人のデータから求めた平均値の標準偏差です」
と答えましょう。ここでは「平均値のーー」という言葉が大事です。
「問2.この2つの図のバーは何を表しているのでしょう?」の答えです。
このバーは1SDすなわち個体の68%が入る幅を示しています。具体的には100人のうち68人がこの中に入ります。平均値のブレではありません。
100人のうち68人が入るって、何も感動を与えてくれません。やはり95人が入るといってもらわないと。それには2SDが必要になります。でも図としてはバーが大きくなりすぎて見映えが もう一つです。だから習慣的に1SDにしているのでしょう。
このバーは1SEすなわち平均値の68%が入る幅を示しています具体的には100試験の平均値のうち68試験の平均値がこの中に入ります。「100試験のうち68試験が1SEのバーの中に入ります」と言われてもピンときませんね。それが95試験といわれると、95%信頼区間が思い浮かびます。すなわち、個体について述べる場合はSDで、平均値について述べる場合はSEを使うということです。
もう一度、分散Vを求める式を見てみましょう。
標準偏差とは、その数値が平均値からどれだけ離れているかを示すもの。数値の広がりを測る方法では最も良いといわれています。
標準誤差は、その平均値が母平均からどれだけ離れているかを示すもので、平均値の信頼度を知るには最も良いのですが、標準偏差の1/√nなので、9試験の場合は√9=3でSDの1/3となります。バーが見かけ上低くなるので、一見、バラツキを小さく見せるために敢えてSEを使っている論文が見られます。個体のバラツキはSEでは表せません。
§3.論文におけるSDとSEの使い分け
浜田先生は著書の中で次のように述べています1)。表からも明らかなように、毒性関連の論文ではSD、薬理関連の論文ではSEが多く使われています。薬理実験では基本的には薬物の平均的な効果を推定することが重要な目的になります。しかしデータはバラツキを伴うため、平均値がどの程度信用がおけるかを示す必要があり、この目的のために使われるのがSEです。一方、毒性試験では平均値はともかく、生データのバラツキ(異常値を示す個体の有無)に強い関心が注がれます。しがってSDを使うことが多くなります。
SDとSEを使い分ける場合、生データのバラツキを表現したいのか、平均値の推定精度を表したいのかを考える必要があります。特に複数群の平均値間の有意差検定の結果を、一緒に表記する場合には、平均値の信頼精度を示すために、SEを表記する必要があります。
※ボクのつぶやき:そうすると、多くの論文でt検定や多重検定でp値や*マークを付けて、±SDを表記しているけど、それって間違い? そうじゃないと思うんだけど。
丹後俊郎先生は2)「目的によっては、標準偏差を用いて151.02±1.53(mean±SD)と表現することもあるが、いずれにせよ、符号±の後の値がSEであるかSDであるかを明確にする必要がある。「次の図はそれが書かれていない悪い例である」と述べている。
※ボクのつぶやき:図でも表でもSDかSEを書いておけば、どちらを 使ってもいいということ、なっとく!
佐久間昭先生3)は、”平均値の“ と平均値を強調したい場合はSEM(standard error of the mean)とする場合もある。平均値のバラツキを示すSEMはnを大きくすれば小さくなる性質があり、これに対して、測定値のバラツキを示すSDはnが変わっても本質的には一定した値であるから、a)データの集団の要約にはSDを用い、b)データの中心位置の要約にはSEを用いた方が良いし、信頼区間を与えればなお良い。
Dr.Altman4)は、結果の提示:t検定か分散分析を使っていれば、各群の標準偏差を示すべき。さらに平均値の信頼区間は標準誤差を示すよりも好ましく、標準誤差はよく用いられるものの、それほど有用ではない。
吉村功編著「毒性・薬効データの統計解析」5)には、「平均±1.96 SD, あるいは平均±2SDを記入するのは、生データの95%ぐらいがその幅の中にあるという意味である。間違えて平均±2SEにしないように注意しなければならない」と書かれています。さらに、「平均の95%信頼区間を表示する場合は、『平均±t(γ,α)SE』とすることとも。
γ=ニュウー=自由度
※ボクのつぶやき:論文でこのような表示を見ることはめったにない。‘t(γ,α)はエクセル関数ではTINV(確率、自由度)で求めます。αを0.05として自由度を“99”とするとt=1.98となり、“49”とすると2.01、“9”だと2.26となります。1.96は999のときの値です。「まちがえて平均±2SEにしないように」という意味は、例数が少ない薬理・毒性試験で単純に2SEと表示すべきではないということなのだろう。なお、2群比較でのt検定ではt(γ、α)の自由度γはn-2であることに注意です
§4.95%信頼区間とp値
注意すべきことは、下の表1のようにp値を併記するときに、「平均値の差のSEを使った信頼区間」を載せると、信頼区間の中にゼロが入れば有意水準5%で“有意差なし”、入っていなければ“あり”ということが分かります。p値が表示されていない場合にも検定結果として使うことができます。
一方、表2のように、95%信頼区間が表示されていても、「差の標準誤差」ではなく、「測定値の 標準誤差」から求めた値が表示されている場合があることに注意すべきでしょう。
Pharmacoは標準偏差と差の95%信頼区間とp値を表示しています。図はSDとSEが選択できるようになっています 。
1)浜田知久馬「新版 学会・論文発表のための統計学」真興交易(株)図書出版部2016年
2)丹後俊郎「医学への統計学」第3版 朝倉書店2013年
3)佐久間昭「医学統計Q&A」金原出版(株)1994年
4)D.G.Altman「医学研究における実用統計学」サイエンティスト社1999年
5)吉村功編著「毒性・薬効データの統計解析」サイエンティスト社2003年