*僅供醫學專業人士參考
全國心血管疾病管理能力評估與提升工程——
CDQI (Cardiovascular Disease Quality Initiative)
,由國家心血管疾病臨床醫學研究中心、中華醫學會心血管病學分會共同開展。
目标是推出一個面向全國、信息共享、分級診療、區域協同并舉的心髒病救治新模式,成為推進“健康中國”全面向前的重要驅動力。
05月13日19:00-19:40,臨床科研培訓第五期活動邀請首都醫科大學附屬北京天壇醫院谷鴻秋教授擔任主講專家,帶來精彩的科普宣教内容!現整理會議内容如下,以供讀者學習與交流!
谷鴻秋教授對如何利用統計圖表,講好研究故事,做了細緻的講解分析。
圖1
谷教授介紹道,當前的統計方法繁多複雜,按照在論文中出現的頻次,在圖1中列舉了一些常用的方法,比如Cox回歸分析、Kaplan-Meier曲線、方差分析等。面對這些統計學常用方法,對于臨床醫生而言,如何區分并有取舍地使用,是一個值得深思的問題。
谷教授講道,統計學的學習過程一般是按照由簡入難的順序,從最基礎過渡到偏難再到偏高級的順序,逐漸深入學習。在最開始學習統計學時,一般從單因素的統計分析方法入手,在涉及到混雜因素的情況下,需采用多因素分析的方法,如線性回歸、Logistic回歸、Cox回歸,并統一到一般線性模型、廣義線性模型等更複雜的統計模型裡。但要注意的是,學會統計學的具體步驟和方法,但不了解其内在聯系,是很難在臨床研究中做到靈活運用的。
谷教授強調,既往學過的的統計學内容,是一個基礎性内容,在此基礎上,從已發表的邏輯非常清楚的臨床研究中,倒推其統計學思維,例如,在這個過程中,如何呈現統計圖表,運用了哪些具體的方法,來完成臨床研究的分析。因此,在提出統計分析需求前,不要急于撰寫統計分析計劃,而應先厘清研究思路,明确研究目的,按照“PICO”的原則進行臨床試驗,并對最終要呈現的統計學量表、在數據庫中的具體定位等都有一個詳細的認知。在這種情況下,研究者才能将“研究故事”講清楚。這樣的研究思路也是非常清晰的,在選題合适、統計學方法把控較好的前提下,臨床研究的發表也會事半功倍。
那麼如何具體地進行統計學分析呢?谷教授認為,可以從已發表的文章中學習和參考,如上圖中所羅列出的一些圖表,存在一些共同的特征。這些圖一般是研究結果的第一部分,即supplemental figure one或figure one,通常叫做study flow chart。從這部分内容,可了解到研究人群是如何篩選的,研究過程的每一步是如何進行的,以及研究中的細節等。
接下來,谷教授講解了統計學中的其他常用圖表。K-M生存曲線可回答的内容是最核心的問題,即試驗組對比對照組的臨床效果。柱狀圖一般是用于統計連續性的變量,比較試驗組和對照組的具體差異,并根據研究需求,繪制一些更加具體的數據對比,進而判斷其具體分層,用鑲嵌度的方式展示出來,從而了解到中位數、平均數等數值水平,兩組間的差異也能一目了然,從不同的時間點,也能觀察到平均值的變化,進而做出合适的幹預。
之後,谷教授繼續介紹了一組統計學圖表,即Table 1,也就是表1。不同研究的表1往往會有不同的呈現方式,可能為兩組數據和P值,也可能隻有兩組數據,沒有第三列,或有其他呈現形式,不一而足。此外,不同的研究,數據展現形式也是不同的,通過統計學方法來進行比較時也會采用不同的方法。這部分圖表的重點在于數據的描述和比較。
接下來的一組圖表是Table2-4的内容,谷教授介紹道,這部分圖表主要是展現效應指标,即OR或HR。在這類圖表中,根據不同的研究類型和研究結局,把比較容易混淆的OR值、RR值或HR值等指标展現出來,側重于回答試驗組相對于對照組對心血管不良事件的具體下降幅度、強化降壓相對于标準降壓的療效變化等核心問題。這類圖表的目的是類似的,但形式略有區别。
上圖中展現的圖表是較為常見的森林圖,具有多種類型。谷教授講道,這種森林圖與荟萃分析中的森林圖不同,在荟萃分析中,每一層代表的是一個研究,而上圖中的森林圖中,每一層代表的是一個亞組,對比試驗組對于對照組的療效。在很多的文章中,針對RCT研究,需要回答主效應以及不同亞組中的效應結果,森林圖可以很好地總結和展現。
以上是臨床研究中常用的一些統計學圖表,将這些圖表有序地組合,可以讓臨床分析更加完整清晰。那麼,應該如何将這些圖表進行組合呢?
谷教授用兩個案例給出了思路,一個是心血管領域的SPRINT研究,一個是神經内科領域的CHANCE研究,均發表在新英格蘭雜志。谷教授認為,常規的統計分析思路可以分為四個步驟,首先是确定分析人群,從Fig 1可以體現失訪數據/退出研究/缺失數據,其次是基線描述比較,Table 1可以體現社會人口學/疾病史/臨床特征,第三是效應估計,Main Table/Fig體現單因素或多因素線性/Logistic/Cox回歸分析内容,最後是敏感性分析,Sup Table/Fig體現人群/模型/定義。遵循這樣的步驟,基本可以講好一個“研究故事”。
谷教授具體講解了SPRINT研究中的具體分析思路。在SPRINT研究中,研究者遵循了“PICOS”的準則,快速獲取這個“研究故事”的核心要義。P是SBP>130mmHg、年齡超過50歲,并伴有心血管危險因素的人群,研究目的是比較強化降壓(SBP降至120mmHg以下)和标準降壓(SBP降至140mmHg以下)(I),對心肌梗死、冠脈綜合征、卒中、心衰以及心源性死亡等終點(O)的效應差異。Study type(S)是RCT研究,T是指研究所用的時間,大約是3.46年。
這個“研究故事”如何展現?首先是要确定分析的研究人群,從study flow chart中可以看到初始篩選的人群,然後找到伴有心血管危險因素的高危人群,可能會有不符合或不願意參加研究的人群,還需要不斷篩選,最終入選的人群中,試驗組和對照組均為4600人。在試驗過程中,部分研究人群可能因多種原因中斷。研究者最終得到一個分析人群,但是其中有一些專業數據,如RCT研究中的ITT、FSG、PBS、SSG等,觀察性研究一般這些要求,僅需把入選/排除标準以及每個步驟的人群明确即可。需要注意的是,同一個病人可能同時符合多條入/排标準,為了避免這種情況,建議采用層次排除法,先按照最重要的标準排除,之後再按照第二個排除标準,逐層級排除,這樣人群一般不會出現重疊的情況。
了解第一步之後,接下來需要用Baseline Table來描述研究人群的具體特征。對于連續性變量,一般用均數±标準差或IQR來描述,對于分類變量,用頻數(百分比%)描述即可。對于大樣本RCT,一般不提供P值,對于小樣本RCT研究則需提供P值,所有的P值均小于0.05,雖然有統計學差異,但在臨床上可能無任何差異。在觀察性研究中,樣本量可能較大,無統計學差異,但需要評價是否存在臨床差異,這種情況下通常使用标化差(ASD)來描述,如果大于10%,可能存在臨床差異,需要校正混雜因素。
第三步是效應估計,主要用于回答最核心的問題,即試驗組相比對照組的效應如何,一般需要使用一些圖表來輔助描述效應變化。在RCT研究中,一般會用到Primary outcome或Secondary outcome等指标,在觀察性研究中,可能不會詳細區分,但在各自的效應終點都會用列表的方式來列舉出來。表格會展示一個Summary式的彙總比較,圖則可以更加生動形象地展現出效應情況。
第四步是敏感性分析,SPRINT研究中強化降壓相對于标準降壓能夠降低20%的風險,但在不同的人群中差異如何?對于強化降壓,臨床中最關注的點在于對腎功能代謝異常的影響,由上圖可知,在慢性腎功能障礙的患者中,強化降壓也是有效的,但效果相對較差。對于不同的性别、年齡、種族以及不同血壓值等均進行敏感性分析,可以回答這項研究結果是否穩健,在不同的人群中是否存在差異。
歡迎轉發,歡迎參加!
CDQI
全國心血管疾病管理能力評估與提升工程
,