Prismロゴ
Prism機能紹介
Cox 比例ハザードモデル(Cox 回帰分析)
無料トライアル版を試す

Cox比例ハザードモデル(Cox 回帰分析)

Cox比例ハザードモデル(Cox回帰分析)は多変量解析の1つで、イベントに対して複数の因子が与える影響を評価する統計手法です。医療統計においては、患者の生存/死亡がイベントとして生存時間解析に用いられ、治療方法や背景因子など複数の要因とイベントの発生の関連性を解析します。

NOTE:生存解析の基本的な概念については、カプランマイヤー生存曲線チュートリアルにて説明しています。

1. Cox 比例ハザードモデルの作成

WelcomeダイアログのNEW TABLE & GRAPHよりMultiple variables を選択します。

このチュートリアルではサンプルデータを使用します。

左側パネルから Multiple variable* をクリックし、Data table: から Start with sample data to follow a tutorial を選択します。

Select a tutorial data set: からCox Propotional hazards Regression (text variables) を選択後、Create ボタンをクリックするとサンプルデータが表示されます。

*サンプルデータは Survivals ではなく、Multiple variables のカテゴリーに用意されています。

2. データ

サンプルデータで使用されるデータは、冠状動脈性心疾患 (CHD) による死亡の潜在的な予測変数を調べた臨床研究の結果として公開されたものです。この研究には 299人の参加者(105人の女性と194人の男性)が含まれ、各々の個人の11の異なる変数の測定値が含まれています。データセットには、参加者ごとに CHD が原因で死亡したか、打切られたかを示す「イベント変数」が含まれています。また時間変数には、研究への登録から死亡または打切られた時間までの各個人の経過生存時間(観察の経過時間)が含まれます。

Prism_Cox 比例ハザードモデルによる生存時間分析_サンプルデータ
画像クリックで拡大表示

それぞれの行は、臨床研究における各個人を表します。それぞれの列は、個人の年齢、性別、検査値などを変数表しています。

  • Time | 観察期間
  • Event | イベント
  • Sex ( Male/Female ) | 性別 (男性/女性)
  • Smoking ( Yes/No )| 喫煙 (あり/なし)
  • Diabetes ( Yes/No ) | 糖尿病 (あり/なし)
  • High blood pressure ( Yes/No ) | 高血圧 (あり/なし)
  • Anemia ( Yes/No ) | 貧血 (あり/なし)
  • Age | 年齢
  • Ejection fraction (Low, Medium, High) | 駆出率(低/中/高)
  • Serum sodium | 血清ナトリウム値
  • Serum creatinine levels (Low, Medium, High) | 血清クレアチニン濃度(低/中/高)
  • Platelet count (Low, Medium, High) | 血小板数(低/中/高)
  • Creatinine phosphokinase (CKP) | クレアチンホスホキナーゼ値(CKP)

サンプルデータで使用するデータは、Ahmad T, Munir A, Bhatti SH, Aftab M, Raza MA (2017) Survival analysis of heart failure patients: A case study. PLoS ONE 12(7): e0181001. https://doi.org/10.1371/journal.pone.0181001で、公開されています。

3. 分析の開始

ツールバーにある Analyzeボタン Analyzeボタン をクリックし、Analyze Data ダイアログを表示します。

Multiple variable analyses  の一覧から Cox proportional hazards regression を選択し、OK ボタンをクリックすると、パラメータ設定ダイアログが開きます。

Parameters: Cox Proportional Hazards Regression ダイアログには以下の8つのタブがあります。

Model | モデル

イベントまでの時間変数、イベント/打切り(アウトカム)変数、推定手法、モデルの定義を選択します。

Reference Level | 基準水準
モデル内のカテゴリー変数に対し「基準水準」または「基準値」を指定します。

Prediction | 予測
Prism によって推定されたモデルを使用し、指定された経過時間とともに予測変数の各値を使用して生存確率を予測します。

Compare | 比較
2つ目のモデルを選択して、2つのモデルのフィットがどのように比較されるべきかについて指定します。

Options | オプション
Prismが出力する結果を指定します。

Goodness-of-fit | フィットの適合度
Prismでどの分析指標を出力するか指定します。

Residuals | 残差
Prismがどの分析残差を出力するべきか、また、それをグラフにするか選択します。

Graphs | グラフ
指定された群の推定された生存確率を、経時的に視覚的に表すグラフを生成するために使用します。

Graphs タブでパラメータでグループを指定し、推定生存曲線を出力してみましょう。このチュートリアルでは下記のグループを指定します。

  • 高血圧(該当)で年齢が40歳のグループ
  • 高血圧(非該当)で年齢が40歳のグループ

Define groups to generate curves の項目で、次のように Variable (変数) と Values (値) を追加します。

1ドロップダウンメニューから High Blood Pressure を選択します。Value(s) は指定しません。

2ドロップダウンメニューから Age を選択します。Value(s) 40 と入力します。

パラメータの設定が完了したら、 OK ボタンをクリックします。

4. Cox 回帰の結果

サイドバーの Results の下に Cox 回帰分析の結果(Cox regression of CHD Sample Data) が出力されます。 結果シートは、Tabular results、 Individual values、Baseline functions のテーブルで構成されています。

4-1. Tabular results | 表形式の結果

Tabular results タブに、パラメータ推定値、ハザード比 (HR)、モデル診断、データサマリーが表示されます。

Prism_Cox 比例ハザードモデルによる生存時間分析_結果シート:Tabular results

Parameter estimates に指定されたモデルのための回帰係数(β係数)の最良適合値が表示されます。一部の他の重回帰手法とは異なり、Cox 比例ハザード回帰は、切片項(β0)を含まないことに注意してください。

β1 : Sex [Male] の値は -0.1879 です。これは、Sex [Male] に比較されるとき、Sex [Male] の対数ハザード率は全ての時間で0.1879低下することを意味します。β6 : Age の値は 0.04589 です。これは、個人の年齢が毎年増加するごとに、対数ハザード率が0.04589 増加することを意味します。

Prism_Cox 比例ハザードモデルによる生存時間分析_結果シート:回帰係数

Hazard ratios にハザード比が表示されます。 ハザード比は、ハザード比に関連した予測変数が1増加したときに、ハザード比が何倍大きい(または小さい)かを表します。

Exp(β6) : Age を見るとハザード比が1.047に等しいことがわかります。これは、参加者の年齢が毎年増えるごとに、参加者のハザード比が 1.047 の倍数で増加することを意味します。数学的に言えば、ハザード比率は指数化されたβ係数といえます(例えば、年齢の1.047のハザード比は、exp(0.04589) に等しく、ここで 0.04589は、このモデルで年齢のβ係数です)。

Prism_Cox 比例ハザードモデルによる生存時間分析_結果シート:ハザード比

Model diagnositics では、指定されたモデルと予測変数(共変量)を含まないモデルの比較情報が表示されます。デフォルトでは、各モデルのパラメータの数と赤池情報量規準(AIC)値が含まれています。

Data Summary では、入力データのサマリーが表示されます。

4.2 Individual values | 個別の値

Individual valuesタブには、入力データテーブルの各個人 (行) について計算された計算値が表示されます。

このテーブルには、各個人の経過時間、線形予測子、ハザード比、および報告された経過時間での各個人に対して生成されたモデルから計算された累積ハザードと累積生存率が含まれています。

 

4.3 Baseline functions | 基準関数

Baseline functions タブには、基準累積ハザード (H0(t)) と基準累積生存 (S0(t)) の基準値が表示されます。

このテーブルは、基準値のグラフの生成に使用されます。基準値は、基準累積ハザードまたは基準累積生存率のどちらかを表示するように設定できます。

また、これらの基準値のグラフは、各予測変数のパラメータ推定値(またはハザード比)を用いて、指定された集団の推定生存率/ハザード曲線を構築することができます。

4. グラフの表示

サイドバーの Graphs の下に "Baseline functions" (基準関数) 、"Scaled Schoenfeld vs Time" (Scaled Shoenfeld 残差)、 "Deviance vs HR" (逸脱度 vs HR) 、"Deviance vs Covariate" (逸脱度 vs 共変量) のグラフに加え、パラメータダイアログで設定を行った "Estimated Survival" (推定生存率)のグラフが出力されているのを確認下さい。

"Estimated Survival" をクリックし、グラフシートを開いてみましょう。

グラフを見やすくするため、グラフインスペクター*の Axes タグで X軸 と Y軸 の数値と目盛りの間隔を変更します。Auto range and interval のチェックを外し、X xsis の Maximum を 50、Interval を 20 に変更します。同様に、Y Axis の Maximum を 1.2、Minor ticks を 1 から 5 にします。

Prism_Cox 比例ハザードモデルによる生存時間分析_グラフ:Estimated Survival

*グラフインスペクターは Prism10 に新たに搭載された機能で、多変量データテーブルのサイドパネルとして表示されます。Format Graph ダイアログを開くことなく、グラフの外観やデザインを変更でき、また変更をリアルタイムで確認することができます。

Prism_Cox 比例ハザードモデルによる生存時間分析_グラフ:推定生存率

グラフから、高血圧に該当する人は該当しない人よりも生存率が低いと推定されていることがわかります。これは、この同じ予測変数のパラメータ推定値(および、ハザード比)に一致します。ハザード比((HR=1.632) が 1 を超える正のパラメータ推定値 (β4 = 0.490)は、高血圧に該当する人はハザードが高い (生存確率が低い)ことを示します。

*言い換えると、血圧が高く心臓や腎臓の機能に低下がみられる高齢の患者は、血圧が低く心臓や腎臓の機能が良好な若い患者に比べ、心不全のリスクが高いということになります。

5. サマリー

この解析の主な結果はパラメータ推定値の形で見ることができます。

モデルをフィットした結果、生存確率に影響を与える主要な予測変数に含まれるのは、年齢(HR=1.047, 95% CI=1.028,1.067)、低駆出率(HR=2.159, 95% CI=1.167,4.231)、高血圧(HR=1.632, 95% CI=1.062,2.485)、高血清クレアチン(HR=2.226, 95% CI=1.391,3.534)であるという決定に至ります。

これらの結果は心不全に関連する危険因子に関する一般的な理解*と一致しているのが直感的に分かります。興味深いことは、性別、喫煙状態と糖尿病を含むいくつかの予測変数は、「有意性」(ハザード比の信頼区間が1を含む) がみられないことでした。この理由について、これらの要因は心不全の初期段階の予測因子とみなされることが多いのに対し、この研究の対象者は心不全が進行した段階を示す集団であるという事実に因るものではないかと、当データを得た著者は示唆しています。

*言い換えると、血圧が高く心臓や腎臓の機能に低下がみられる高齢の患者は、血圧が低く心臓や腎臓の機能が良好な若い患者に比べ、心不全のリスクが高いということになります。

参照:GraphPad Prism Statistics Guide - Example: Cox proportional hazards regression