完全な説明リンク:http://tecdat.cn/?p=5438
生存分析は、それが起こる関心のイベントを調査するのにかかる時間のための統計手法のセットに対応しています。
生存分析は、など様々な分野で使用されました。
がん研究は、生存期間の分析であります
社会学「イベント履歴分析」
作品には「ダウンタイム分析。」
次のように癌研究では、代表的な研究課題は以下のとおりです。
患者の生存期間の特定の臨床的特徴の影響は何ですか?
人の3年間の生存確率はどのくらいですか?
各群の患者の生存率は、違いは何がありますか?
基本コンセプト
ここでは含めて、長期生存分析の基本的な定義を開始します。
生存期間とイベント
生存関数とハザード関数
がん研究とイベントタイプで生存期間
イベントなど、さまざまな種類のがあります。
再発
死
「治療への応答」(完全寛解)から関心のあるイベントに発生時刻と一般に呼ば生存時間(またはイベントが発生した時間)。
最も重要な施策の2におけるがん研究が含まれた:i)死の時間 ;およびii)非無再発生存期間、治療応答および疾患再発の間の時間に相当し、。また、非として知られて無病生存期間および非イベントフリー生存期間。
上述したように、生存分析は、関心のあるイベントが発生するまでの予想時間(再発または死)に焦点を当てています。
カプランマイヤー生存評価
カプラン - マイヤー(KM)法(カプランおよびマイヤー、1958)が観察生存時間の生存確率の推定のためのノンパラメトリックな方法です。
KM生存曲線は、データの有用な概要は、生存期間の中央値等の指標を推定するために使用することができる提供し、生存および時間管理の知識の確率のプロットです。
R生存分析
パケットRをインストールして読み込みます
我々は2つのRパッケージを使用します。
生存は、生存分析を計算しています
survminerの生存分析の概要と結果の可視化
サンプルデータセット
我々は提供肺がんの生存パッケージ内のデータを使用します。
研:機関コード
時間:の時代に生存期間
ステータス:ステータス見直しの見直し= 1、2 =死
年齢:年齢
性別:男性= 1女= 2
ph.ecog:ECOGパフォーマンススコア(0 =良い5 =死)
ph.karno:医師によって評価カルノフスキーのパフォーマンススコア(悪い= 0-良い= 100)
pat.karno:患者の評価によるカルノフスキーのパフォーマンススコア
食事:食事中に消費カロリー
wt.loss:減量の最後の6ヶ月間
計算生存曲線:survfit()
私たちは、性別によって生存確率を計算します。
関数survfit [IN()生存パッケージ]は、カプラン-マイヤー生存推定値を計算するために使用することができます。その主なポイントに含まれます:
機能を使用しSurvを生き残るためにオブジェクトを作成します()
生存曲線を計算するには、次のように入力します。
デフォルトでは、機能のプリントは、()生存曲線の簡単な要約を表示します。これは、観測数、イベント、生存期間の中央値と信頼限界の中央値の数を示します。
あなたは生存曲線のより完全な要約を表示したい場合は、次のように入力します。
可視化の生存曲線
私たちは、被験者の両群の生存曲線を生成します。
legend.labs凡例のラベルを変更します。
各群の生存期間中央値は、0.5倍の生存確率S(t)を表しています。
パラメータXLIMは次のように、生存曲線を短縮することができます。
あなたはパラメータを使用できることに注意してください楽しみを頻繁に使用される3人の改宗を指定します:
累積ハザードは、一般的に危険の確率を推定するために使用されます。
生存曲線をまとめたもの:カプランマイヤー生命表
如上所述,您可以使用函数summary()来获得生存曲线的完整摘要:
在生存曲线已经与一个或多个变量拟合的情况下,surv_summary对象包含表示变量的额外列。这使得有可能根据地层或某些因素的组合来面对ggsurvplot的输出。
Log-Rank检验比较生存曲线:survdiff()
对数秩检验是比较两条或更多条生存曲线的最广泛使用的方法。零假设是两组在生存期间没有差异。
可以使用survdiff()如下:
存活率差异的对数秩检验给出p = 0.0013的p值,表明性别组在存活方面差异显着。
复杂的生存曲线
在本节中,我们将使用多个因素的组合计算生存曲线。接下来,我们将面向ggsurvplot()的输出结合因素
使用幸存者可视化输出。下面的图显示了性别变量根据rx&adhere的值生存的曲线。
生存分析对应于一组统计方法,用于调查感兴趣事件发生所花费的时间。
生存分析被用于各种领域,例如:
癌症研究为患者生存时间分析,
“事件历史分析”的社会学
在工程的“故障时间分析”。
在癌症研究中,典型的研究问题如下:
某些临床特征对患者的生存有何影响?
个人三年存活的概率是多少?
各组患者的生存率有差异吗?
概要
生存分析是一组数据分析的统计方法,其中感兴趣的结果变量是事件发生之前的时间。
在这篇文章中,我们演示了如何使用两个R软件包的组合来执行和可视化生存分析:生存(用于分析)和生存者(用于可视化)。
有问题欢迎联系我们!
大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务
統計解析やデータマイニングコンサルティングサービス:y0.cn/teradat(コンサルティングサービスは、お問い合わせください公式サイトの顧客サービスを)
[サービス]シーン
オンラインとオフラインの1つのトレーニング;研究;会社のアウトソーシングデータ収集、学術研究、報告書作成、市場調査。
[トライブ]ビッグデータは、カスタマイズされたワンストップ・データマイニングや統計解析のコンサルティングを提供するために
私たちの選択科目へようこそR言語データ解析を採掘が知っているだろうコースを!