カプランマイヤー法(Kaplan-Meier) を用いて生存比率を計算し、生存曲線のグラフ作成を例にPrism5の統計およびグラフ作成機能を紹介します。[「統計ガイド」pg213-215より]
Prism4におるカプランマイヤー生存分析については、こちらをご参照下さい。
Prismは生存比率(survival fractions)をカプランマイヤー (Kaplan-Meier) 法を用いて計算します。個々のX値(時間)に対し、Prismは生存しているものの比率(あるいは曲線を1.0ではなく0.0からスタートするように選択した場合には死んだものの比率)を表示します。このテーブルは生存曲線のプロットに必要な基礎数値を提供することになります。
Prismは生存比率の不確定さを標準誤差、または95%信頼区間としてレポートします。標準誤差の算出にはグリーンウッドの公式が用いられます。一方、95%信頼区間の方は各方向、標準誤差x1.96として計算されます。このように算出された信頼区間は時として0.0と1.0の範囲を越える場合があります。このような場合、エラーバーは自動的にクリッピングされます。
計算に際しては打切られた(censored)観測値についても配慮が払われます。データが打切られた対象(調査から離脱したとか、調査期間が終了したケース)は打切り時点以降、いかなる情報も貢献することはありません。このことによって生存率の計算は手が込んだものとなります。生存比率の計算値は、死んだ対象の数を対象の総数で割った値で終わるべきように思えますが、それは打ち切られたデータが全くない場合にのみ成立します。対象の一部を打ち切った場合、すべての対象が同一期間フォローされたことにはならないため、生存比率の計算は単純なものではなくなります(そこにカプランマイヤー法の本質があります)。
下に示すダイアログ中で「生存分析」タブを選択、目的に合致したグラフを選択します。 データ入力の準備が整っていないときにはサンプルデータを使用してください。データセットとしてはどれでも構いません。


次のガイドラインに従って対象ごとのデータを表の各行に入力します。
死(またはトラッキングしている事象)、または打ち切るまでの時間をXカラムに入力します。時間の単位としては都合の良いもの(日、月、等)を適宜使用できます。時刻0は特定の日付である必要はありません。それは個々の対象が調査に加わった日時として定義されるため、対象によって日付が異なっていても構いません。臨床的な調査の場合には患者を募集するのに時間を要するため、時刻0が数年にまたがることもあります。時間の値は数値で入力してください。日付を直接指定することはできません。 個々の対象を特定するための行タイトルを入力することもできます。
Xカラムに示される時点で対象が死亡(あるいは特定の事象が発生)した場合には、該当するYカラムに"1"を入力します。対象データが打切られた(censor)場合には"0"を入力します。
治療グループごとに異なるYカラムを使用してください。最初のグループに属する対象のXデータはテーブルの先頭から順に入力して行きます。その際、Yコードは最初のYカラムに入力します。第2のグループに属する対象のXデータは第1のグループに続く形で入力します(Xデータはソートしてある必要はありませんし、同じ値が何回も出現しても構いません)。対応するYコードは2番目のYカラムに入力します。以下の例の場合、グループAのデータは最初の10行に入力され、グループBのデータは行11から始まっています。
治療グループのデータが本質的に順序付けられている場合(恐らく用量順)、データ入力に際してもその順序を保持するようにしてください。またカラムAからB, Cへの遷移は治療グループの自然な順序に従うようにしてください。治療グループにそのような順序性がない場合にはどう並べ変えても構いません。
生存分析機能は他の分析機能と異なる動作をします。生存表を選択した場合、Prismは自動的にデータの分析を行います。「分析」ボタンをクリックする必要はありません。
データ入力が終了したらgraphフォルダを選択、作成された生存曲線が確認できます。またResultsフォルダ中には曲線間の比較を行うログランク検定の結果も収納されています(データセットが複数ある場合)。 Prismでは生存データのグラフ化に関し多数の選択肢が用意されています。
ここに示されているように生存曲線は通常階段状のグラフとなります。それぞれの死は生存率のドロップとして表されます。
左側の図の場合、データはティックマークでプロットされます。ただし死亡時の場合のティックマークは省略されます。従ってティックマークは対象のデータが打切られた(censored)時点を示すことになります。この例では100-150日の間に治療グループから2つのデータがcensorされたことがわかります。
右側のグラフではデータは丸印でプロットされています。

エラーバーやエラー曲線(error envelope)を表示することによって生存グラフにはより多くの情報が含まれることになりますが、やや乱雑な印象を与えます。左側のグラフでは生存曲線に対する95%信頼区間が階段状の包絡線で描かれています。一方、右側のグラフでは生存率に対する標準誤差がエラーバーの形でプロットされています。ただし階段状の曲線とエラーバーとが重なってしまうことを防ぐため、データ点間は通常の折れ線で結ばれます。

Prismはそれぞれの時点においてAt Riskの対象数をテーブル化します。At Riskの対象数は対象が死んだり打切られたりするたびに減少します。 Prismはこのテーブルを自動的にはグラフ化しません。危険な状態にある対象数の時間変化をグラフ化したい場合には次のように操作します。
Resultsフォルダの結果の右向き三角矢印をクリックすると、サブページが表示されます。サブページから、「# of Subjects at risk」を開きます。
「New」をクリック、「Graph of existing data」を選択します。
「XYプロット」を選択、エラーバーなしのグラフを選択します。
Y軸タイトルを"At Riskの対象数"、X軸タイトルを"日数"に変更します。