PRISM5統計・グラフ作成テクニック

カプランマイヤー(Kaplan-Meier) 法を用いて生存比率を計算し、生存曲線のグラフ作成を例にPrism5の統計およびグラフ作成機能を紹介します。

カプランマイヤー生存比率

Prismは生存比率(survival fractions)をカプランマイヤー (Kaplan-Meier) 法を用いて計算します。個々のX値(時間)に対し、Prismは生存しているものの比率(あるいは曲線を1.0ではなく0.0からスタートするように選択した場合には死んだものの比率)を表示します。このテーブルは生存曲線のプロットに必要な基礎数値を提供することになります。

Prismは生存比率の不確定さを標準誤差、または95%信頼区間としてレポートします。標準誤差の算出にはGreenwood法が用いられます。一方、95%信頼区間の方は各方向、標準誤差x1.96として計算されます。このように算出された信頼区間は時として0.0と1.0の範囲を越える場合があります。このような場合、エラーバーは自動的にクリッピングされます。

計算に際しては打切られた(censored)観測値についても配慮が払われます。データが打切られた対象(調査から離脱したとか、調査期間が終了したケース)は打切り時点以降、いかなる情報も貢献することはありません。このことによって生存率の計算はトリッキーなものとなります。生存比率の計算値は、死んだ対象の数を対象の総数で割った値で終わるべきように思えますが、それはcensoredデータが全くない場合にのみ成立します。対象の一部がcensorされた場合、すべての対象が同一期間フォローされたことにはならないため、生存比率の計算は単純なものではなくなります(そこにカプランマイヤー法の本質があります)。

 

1. 生存表の作成

下に示すダイアログ中で「生存分析」タブを選択、目的に合致したグラフを選択します。 データ入力の準備が整っていないときにはサンプルデータを使用してください。データセットとしてはどれでも構いません。

カプランマイヤー生存表作成

2. 生存時間の入力

次のガイドラインに従って対象ごとのデータを表の各行に入力します。

死(またはトラッキングしている事象)、またはcensorまでの時間をXカラムに入力します。時間の単位としては都合の良いもの(日、月、等)を適宜使用できます。時刻0は特定の日付である必要はありません。それは個々の対象が調査に加わった日時として定義されるため、対象によって日付が異なっていても構いません。臨床的な調査の場合には患者を募集するのに時間を要するため、時刻0が数年にまたがることもあります。時間の値は数値で入力してください。日付を直接指定することはできません。 個々の対象を特定するための行タイトルを入力することもできます。

 

Xカラムに示される時点で対象が死亡(あるいは特定の事象が発生)した場合には、該当するYカラムに"1"を入力します。対象データが打切られた(censor)場合には"0"を入力します。

治療グループごとに異なるYカラムを使用してください。最初のグループに属する対象のXデータはテーブルの先頭から順に入力して行きます。その際、Yコードは最初のYカラムに入力します。第2のグループに属する対象のXデータは第1のグループに続く形で入力します(Xデータはソートしてある必要はありませんし、同じ値が何回も出現しても構いません)。対応するYコードは2番目のYカラムに入力します。以下の例の場合、グループAのデータは最初の10行に入力され、グループBのデータは行11から始まっています。

 

治療グループのデータが本質的に順序付けられている場合(恐らく用量順)、データ入力に際してもその順序をキープするようにしてください。またカラムAからB, Cへの遷移は治療グループの自然なオーダに従うようにしてください。治療グループにそのような順序性がない場合にはどう並べ変えても構いません。

生存分析機能は他の分析機能と異なる動作をします。生存表を選択した場合、Prismは自動的にデータの分析を行います。「分析」ボタンをクリックする必要はありません。

 

3. グラフと結果の表示

データ入力が終了したらgraphフォルダを選択、作成された生存曲線が確認できます。またResultsフォルダ中には曲線間の比較を行うログランク検定の結果も収納されています(データセットが複数ある場合)。 Prismでは生存データのグラフ化に関し多数の選択肢が用意されています。


エラーバーなしのグラフ

ここに示されているように生存曲線は通常階段状のグラフとなります。それぞれの死は生存率のドロップとして表されます。

左側の図の場合、データはティックマークでプロットされます。ただし死亡時の場合のティックマークは省略されます。従ってティックマークは対象のデータが打切られた(censored)時点を示すことになります。この例では100-150日の間に治療グループから2つのデータがcensorされたことがわかります。
右側のグラフではデータは丸印でプロットされています。

カプランマイヤーグラフ エラーバーなし

エラーバー付のグラフ

エラーバーやエラー曲線(error envelope)を表示することによって生存グラフにはより多くの情報が含まれることになりますが、やや乱雑な印象を与えます。左側のグラフでは生存曲線に対する95%信頼区間が階段状の包絡線で描かれています。一方、右側のグラフでは生存率に対する標準誤差がエラーバーの形でプロットされています。ただし階段状の曲線とエラーバーとが重なってしまうことを防ぐため、データ点間は通常の折れ線で結ばれます。

カプランマイヤーグラフ エラーバー付


危険な状態にある対象の数
Prismはそれぞれの時点において依然危険な状態にある患者数をテーブル化します。依然危険な状態にある対象(subjects at risk)の数は対象が死んだり打切られたりするたびに減少します。 Prismはこのテーブルを自動的にはグラフ化しません。危険な状態にある対象数の時間変化をグラフ化したい場合には次のように操作します。

Resultsフォルダの結果の右向き三角矢印をクリックすると、サブページが表示されます。サブページから、「# of Subjects at risk」を開きます。

「New」をクリック、「Graph of existing data」を選択します。

「XYプロット」を選択、エラーバーなしのグラフを選択します。

Y軸タイトルを"At Riskの対象数"、X軸タイトルを"日数"に変更します。


PRISMグラフ作成テクニック

以下の例は、Prismについての多くの有用なグラフ作成テクニックや機能を知っていただくものです。 日本語の各セクションのタイトルをクリックすると、オンラインのPDF形式で見られます 。これらの例は、Prism4のStep by Stepとして付属していたものです。

 

Prism_一元配置分散分析(ANOVA)

事後テストでの一元配置ANOVAやノンパラメトリック分析を実行し、列の記述統計量を求め表示します。

Prism_折れ線グラフと棒グラフの結合 width=

シンボルを棒に変更し、XYグラフから棒グラフを作成します指数減衰曲線をフィットし、右Y軸を追加します。

 

Prism_理論曲線群

各曲線に対して、あるパラメータを定数とし1つの独立変数を連続的にプロットします。

Prism_1グループ変数による棒グラフ

1グループ変数毎にまとめられたデータをグラフ化し、グラフを編集します。選択した列の記述等計量を求めます。

Prism_ヒストグラムと度数分布

ヒストグラムに「相対度数」VS「累積度数」をプロットします。ヒストグラムにフィットしたガウス曲線を重ねてプロットします。

 

Prism_t検定の実行

t検定は、最も一般的な統計手法であり、通常異なる実験で求められた2群の観測結果を比較するものです。