検定力分析(Power Analysis)によって検出力を確認したり標本サイズを決定することは、実験を正しく効率的に行う上で重要な役割を果たします。
有意差検定を行う場合、次の過誤の確率の可能性を考慮する必要がありあます。
検定力とは有意であるときに正しく検出できる確率(1-β)をいいます。検出力分析は結果を正しく解釈する上で役に立つといえます。ここでは、検定力分析による解釈について説明します。
Motulsky・他は高血圧症の患者の場合、血小板上のアドレナリン受容体であるα2の数に変化が生じているのではと報告しています(Clinical Science 64:265-272, 1983)。高血圧症では自律神経系受容体の数に変化が生ずると考えられています。ここではアクセスのしやすさから血小板について調査することにしました。結果は次の通りです。

標本数 |
18 | 17 |
|---|---|---|
受容体数平均 |
257 | 263 |
標準偏差 |
59.4 | 86.6 |
平均値はほとんど同一のため、t検定の結果は高いP値となっています。そこで高血圧症の患者の血小板ではα2受容体の数に変化が生じていないという結論を出しました。
これらの否定的なデータは信頼区間、あるいは検出力分析という手法で解釈が行えます。両者は等価なものであり、データに対する考え方が異なるだけです。
(仮に差があったとして)差を検出する能力はどれだけあったのでしょうか。その答えは差が実際にどの程度大きかったかによります。右のグラフは、StatMateを使用して結果をグラフにしたものです。 大きな差に対しては大きな検出力を持ち、小さな差に対しては小さな検出力しか持たないというのはすべての実験に対して言えることです。従って検出力に関するグラフは皆同様の形状になります。グラフをどう解釈するかは科学的コンテクスト次第です。ここでも対向する解釈を示しておきます。
1)我々は血小板中の受容体ではなく、心臓や腎臓、脳、血管中の受容体に関心がある。従って差が50%程度の場合にのみ結果を追究する。
血小板上の受容体数の平均は約260であることからして、130前後の差があれば実験は評価に値する。グラフからすると、今回の実験は130前後の差分に対して極めて高い検出力を有する 。言い換えれば、それだけの差が実際に存在した場合、今回の実験であればほぼ 間違いなく統計的に有意な差を検出していたはずである。従って今回の結果は明 解に否定的な結果を物語っている。
2)問題分野は高血圧症である。物事は単純ではない。効果は明確な形では現れず、可能な限りデータを分析すべきである。
50%の差が見つけられるに越したことはないが、高血圧症の複雑さからして、現実的にはそのような結果は望み得ない。差分がたとえ20%であったとしても調査検討を継続したい。血小板上の受容体数平均が約260であることからして、約50前後の差を検出したい。グラフからすると、今回の実験の場合、約50の差分を検出する能力は50%でしかない。すなわち実際に約50の差があったとしても、今回の実験でそれを検知できた確率は50%だったと いうことになる。検出力がこの程度なのだから、今回の実験から結論付けられることは余りない。レビューワや編集者はこの点に考慮するなら、当該研究の結果を公表することに意味のないことは容易にわかるであろう。
以上のように、検出力の解釈はどの程度の差が科学的に、あるいは現実的に重要であるかの認識に依存します。異なった結論に至ったとしてもそれなりの根拠があると言えます。実験の検出力を細かく調べてみても有意差が検出できるようになるわけではありません。これはよく見られる誤解です。
与えられた目標が単に結果の解釈にあるのであれば信頼区間を用いた手法で十分 です。目標が他の研究を批評したり、将来の実験について企画検討することにあるのであれば、検出力分析の併用が有効でしょう。
「この実験の検出力はどのくらいか」という質問には答えようがありません。「 これだけの大きさの効果を検出するとしたとき、この実験の検出力はどのくらいか」という質問のしかたをすべきです。効果の大きさとしてはどの程度を想定するか。どのくらい大きな差を期待すべきか。データについて科学的に検討する際 、検出力分析は意味を持ちます。それは単なる統計上の質問ではなく、科学的な質問だからです。 プログラムの中には検出力に関する一つの値だけを算出し、プロセス中から思考を取り去ろうとするものがあります。これらは特定の実験で実際に観測された効果の大きさ(差、相対リスク、等)を用い、それを検出するための検出力を計算します。結果は時に観測検出力(observed power)、そのプロシジャは事後検出力分析(post-hoc or retrospective power analysis)と呼ばれます。
科学的に、あるいは臨床的に価値があるであろうある仮想的な差を想定し、それを検出する上での検出力を知ることには意味があります。
GraphPad StatMateはその計算を支援する機能を提供します。