劉暢1 賀永明1
1. 蘇州大學(xué)附屬第一醫(yī)院心內(nèi)科
長(zhǎng)久以來(lái),人類(lèi)已經(jīng)習(xí)慣了對(duì)事物的探究以及對(duì)其奧秘的揭示。醫(yī)學(xué)作為人類(lèi)的重大課題,前赴后繼的努力使今天的醫(yī)學(xué)大廈直入天際。對(duì)疾病發(fā)展趨勢(shì)的把握及其危險(xiǎn)因素的界定,使我們對(duì)抗疾病充滿(mǎn)信心。
疾病發(fā)生發(fā)展存在太多的危險(xiǎn)因素,對(duì)潛在危險(xiǎn)因素的甄別和判定對(duì)疾病的預(yù)防和治療意義重大。在醫(yī)學(xué)研究,尤其是流行病學(xué),我們更多地借助于統(tǒng)計(jì)學(xué)幫助我們分析研究因素對(duì)疾病的作用。而其中,對(duì)于研究變量是否與疾病相關(guān),是否存在閾值效應(yīng),以及發(fā)病風(fēng)險(xiǎn)隨研究變量的變化趨勢(shì)是我們?cè)诹餍胁』蛘吲R床研究中的所要解決的問(wèn)題。筆者根據(jù)自己對(duì)臨床研究的經(jīng)驗(yàn)和理解,對(duì)閾值的判斷以及趨勢(shì)檢驗(yàn)方面的問(wèn)題給出自己的見(jiàn)解,拋磚引玉,與大家分享學(xué)習(xí)。
閾值效應(yīng):1. 閾值效應(yīng)的判斷方法
在中國(guó)漢語(yǔ)詞典中,閾值被定義為:在自動(dòng)控制系統(tǒng)中能產(chǎn)生一個(gè)校正動(dòng)作的最小輸入值或刺激引起應(yīng)激組織反應(yīng)的最低值。而在生理學(xué)及醫(yī)學(xué)領(lǐng)域,閾值更是為我們所熟知,如動(dòng)作電位的閾電位以及糖尿出現(xiàn)的腎糖域等。閾值的設(shè)立為我們理解和把握一系列生理過(guò)程及疾病進(jìn)展變化提供了有力的幫助。
在病例-對(duì)照研究中,我們確定一個(gè)研究因素后,不可避免得要考慮其他因素即混雜因素的影響,目前最常用的方法為利用Logistic回歸構(gòu)建擬合模型,校正混雜因素,進(jìn)而量化各變量對(duì)疾病的影響。同樣,在Logistic回歸分析中,研究變量對(duì)疾病作用的閾值問(wèn)題值得我們深思和探討。通過(guò)閱讀相關(guān)文獻(xiàn),筆者發(fā)現(xiàn)以往對(duì)于閾值的分析只限于跳躍性選取幾個(gè)研究變量的節(jié)點(diǎn),并以該節(jié)點(diǎn)為界進(jìn)行二分類(lèi),進(jìn)而得出相對(duì)風(fēng)險(xiǎn)比,以此判定閾值的存在與否。筆者認(rèn)為這樣簡(jiǎn)單依據(jù)某幾個(gè)點(diǎn)的相對(duì)風(fēng)險(xiǎn),并不能真正準(zhǔn)確反映出疾病發(fā)病風(fēng)險(xiǎn)與研究變量水平之間的關(guān)系,因此得出的所謂的閾值效應(yīng),其說(shuō)服力也就相對(duì)較弱,所得的結(jié)論不準(zhǔn)確甚至是錯(cuò)誤的。究竟應(yīng)該以怎樣的方式確定閾值效應(yīng)呢?筆者從可興奮細(xì)胞的動(dòng)作電位得到些許啟示。動(dòng)作電位大家都十分熟悉,此處以心肌細(xì)胞為例(圖1)。閾電位的發(fā)現(xiàn)是基于對(duì)膜電位水平的描記,通過(guò)直觀(guān)的觀(guān)察膜電位變化圖形,即可發(fā)現(xiàn),在膜電位連續(xù)變化的過(guò)程中,當(dāng)刺激使膜電位復(fù)極達(dá)到某個(gè)值時(shí),動(dòng)作電位才會(huì)發(fā)生,小于達(dá)到該膜電位的刺激只會(huì)使膜電位產(chǎn)生小幅度的波動(dòng),并不會(huì)產(chǎn)生趨勢(shì)上的變化。因而我們將該膜電位定義為閾電位,對(duì)應(yīng)的刺激大小為閾刺激。也就是說(shuō),閾值是自變量達(dá)到某個(gè)節(jié)點(diǎn)水平后,因變量的變化趨勢(shì)發(fā)生明顯的本質(zhì)上的改變。與此相似,筆者認(rèn)為對(duì)于研究變量,尤其是連續(xù)型的研究變量,當(dāng)探究其對(duì)發(fā)病率的影響的閾值效應(yīng)時(shí),也應(yīng)該進(jìn)行連續(xù)的多點(diǎn)估計(jì),通過(guò)線(xiàn)性得觀(guān)察隨著研究變量水平的變化,疾病發(fā)病風(fēng)險(xiǎn)的變化趨勢(shì),進(jìn)而確定是否存在閾值,以及閾值的確切數(shù)值。
圖1
例如,血清Lp(a)濃度與2型糖尿?。═2DM)關(guān)系的研究中,在WHS(Women’s Health Study)人群中,研究認(rèn)為L(zhǎng)p(a)濃度與T2DM的發(fā)生存在反向相關(guān)關(guān)系,并在Lp(a)濃度上四分位中(<39mg/L)進(jìn)一步探究閾值效應(yīng)[1]。分別以10、20、30、40mg/L,作為二分類(lèi)分割點(diǎn),以大于等于分割點(diǎn)濃度組作為參照計(jì)算相對(duì)風(fēng)險(xiǎn)比,并發(fā)現(xiàn)所有的結(jié)果均具有統(tǒng)計(jì)學(xué)意義(p<0.05)。進(jìn)而得出血清中Lp(a)的相對(duì)缺乏可能會(huì)增加T2DM的患病風(fēng)險(xiǎn)的結(jié)論。然而,我們?cè)谥袊?guó)漢族人群中求證血清Lp(a)濃度對(duì)T2DM的閾值效應(yīng)時(shí)卻得出了不同的結(jié)論[2]。我們將濃度≤50mg/L的Lp(a)以1mg/L為間距進(jìn)行50等分,獲取50個(gè)連續(xù)的二分類(lèi)分割點(diǎn),并以濃度小于等于分割點(diǎn)組作為參照,連續(xù)得獲得相應(yīng)分割點(diǎn)的相對(duì)風(fēng)險(xiǎn)比,以類(lèi)似動(dòng)作電位描記的形式給出(圖2。其中,對(duì)T2DM的點(diǎn)估計(jì)以黑色正方形表示,對(duì)CAD的點(diǎn)估計(jì)以黑色三角形表示)。圖中我們可以看到,隨著Lp(a)濃度分割點(diǎn)水平的變化,2型糖尿病的發(fā)病風(fēng)險(xiǎn)OR值及其95%置信區(qū)間基本上處于“1”的波動(dòng)范圍之內(nèi),即Lp(a)濃度水平與2型糖尿病的發(fā)病無(wú)關(guān),整體趨勢(shì)平穩(wěn)變化,并無(wú)所謂的閾值效應(yīng)。同時(shí),我們也對(duì)Lp(a)對(duì)冠心?。–AD)發(fā)病風(fēng)險(xiǎn)的閾值效應(yīng)進(jìn)行了探究,可以看出,血清Lp(a)濃度與CAD顯著相關(guān),但隨著分組分割點(diǎn)的變化,CAD的發(fā)病風(fēng)險(xiǎn)也未表現(xiàn)出明顯的變化趨勢(shì),亦無(wú)閾值效應(yīng),這與以往的研究結(jié)果相一致。值得注意的是,在分割點(diǎn)10、20mg/L處,低濃度的Lp(a)的確表現(xiàn)出對(duì)2型糖尿病的風(fēng)險(xiǎn),與WHS人群的研究吻合,但在30、40mg/L分割點(diǎn)處,Lp(a)濃度與T2DM的發(fā)病無(wú)關(guān),這與WHS人群的研究相悖。仔細(xì)觀(guān)察圖形可發(fā)現(xiàn),其實(shí)在10、20mg/L分割點(diǎn)及其兩側(cè)附近的其他分割點(diǎn)均近乎或者完全未反應(yīng)出Lp(a)與T2DM相關(guān),我們認(rèn)為10、20mg/L分割點(diǎn)處所表現(xiàn)出來(lái)的效應(yīng)是由于組中事件數(shù)過(guò)少而出現(xiàn)的隨機(jī)結(jié)果。WHS人群研究中未進(jìn)行連續(xù)的閾值估計(jì),在不知道連續(xù)趨勢(shì)的情況下,其所得結(jié)論值得商榷。足以看出單純以特定的點(diǎn)去估計(jì)總體趨勢(shì)的片面和不足,甚至?xí)?duì)研究結(jié)論造成誤導(dǎo)。我們應(yīng)該從整體的、連續(xù)的變化趨勢(shì)去判定閾值,準(zhǔn)確找出趨勢(shì)變化的拐點(diǎn),單純依據(jù)個(gè)別分割點(diǎn)的估計(jì),是不準(zhǔn)確、不可取的。
圖2
2. 閾值效應(yīng)的求證演示
接下來(lái),筆者具體講解閾值效應(yīng)的求證過(guò)程:筆者所用軟件為STATA13.0。演示數(shù)據(jù)來(lái)為《Lipoprotein (a) is not significantly associatedwith type 2 diabetes mellitus: cross-sectional study of 1604 cases and 7983controls》研究的CCSSSCC數(shù)據(jù)集。
正如研究中所描述的,為探究血清Lp(a)濃度在T2DM發(fā)病風(fēng)險(xiǎn)中的閾值效應(yīng),我們將濃度≤50mg/L的Lp(a)以1mg/L為間距進(jìn)行50等分,獲取50個(gè)連續(xù)的二分類(lèi)分割點(diǎn),即依據(jù)每個(gè)分割點(diǎn)將總體人群分為兩組,Lp(a)濃度小于等于分割點(diǎn)組和Lp(a)濃度大于分割點(diǎn)組。此過(guò)程我們可以通過(guò)以下
命令:
gen dilpa1=0
replace dilpa1=1 if lpadl>1
結(jié)果:
其中我們定義變量dilpa1為以L(fǎng)p(a)濃度1mg/L為分割點(diǎn)得到的二分類(lèi)變量。變量lpadl為以mg/L為單位的Lp(a)濃度??梢?jiàn),Lp(a)濃度大于1mg/L的樣本量為9179。
進(jìn)一步,我們要對(duì)所產(chǎn)生的變量dilpa1是否符合我們的要求進(jìn)行驗(yàn)證:
命令:
tabstat lpadl,stats(n min max ) by(dilpa1)
結(jié)果:
如結(jié)果所示,dilpa1=0組的lpadl最大值為1,dilpa1=1組的lpadl最小值為1.1,變量dilpa1確系以1為分割點(diǎn)得到的二分類(lèi)變量。通過(guò)以上方式,我們可以繼續(xù)連續(xù)得到分別以L(fǎng)p(a)濃度為2、3、4、……、50mg/L為分割點(diǎn)的共50個(gè)二分類(lèi)變量。
接下來(lái),將以上獲得的二分類(lèi)變量依次代入本研究中的全因素校正的Logistic回歸模型中。此處以變量dilpa1為例,演示在總體人群中,以dilpa1=0為參照,dilpa1=1組對(duì)T2DM發(fā)病的OR值及其95%置信區(qū)間。
命令:
logistic DM_CAD i.dilpa1age nsex i.ndrinking i.nsmoking group01 nhypertension nischemicbd nbleedingbdnbmi ntg hdlc ldlc year nalb ncr
結(jié)果:
如結(jié)果所示,我們可以得到以L(fǎng)p(a)濃度1mg/L為分割點(diǎn)時(shí),相對(duì)小于等于1mg/L組,濃度大于1mg/L組的OR值及其95%置信區(qū)間。其中,變量DM_CAD=0代表既無(wú)糖尿病也無(wú)冠心病組;DM_CAD=1代表單純患糖尿病組。
通過(guò)依次代入連續(xù)的不同分割點(diǎn)的二分類(lèi)變量,我們最終可獲得50個(gè)對(duì)應(yīng)的OR值及其95%置信區(qū)間。筆者將其整理為STATA數(shù)據(jù),此處以“l(fā)ist”命令將其列出。
命令:
list
結(jié)果:
最后,我們將不同Lp(a)濃度分割點(diǎn)在T2DM的發(fā)病中的OR值及其95%置信區(qū)間,以類(lèi)似動(dòng)作電位描記的形式,以圖形給出其整體變化趨勢(shì)。
命令:
graph twoway rcap uci lcidilpax ,lcolor(green) || scatter or dilpax, mcolor(red) msymbol(square) msize(1) yline(1,lcolor(black))
結(jié)果:
由圖形可以直觀(guān)地看出,隨著不同Lp(a)濃度節(jié)點(diǎn)的變化,T2DM發(fā)病風(fēng)險(xiǎn)并無(wú)明顯的趨勢(shì)變化,即無(wú)閾值效應(yīng)存在。
正如研究中所描述的,為探究血清Lp(a)濃度在T2DM發(fā)病風(fēng)險(xiǎn)中的閾值效應(yīng),我們將濃度≤50mg/L的Lp(a)以1mg/L為間距進(jìn)行50等分,獲取50個(gè)連續(xù)的二分類(lèi)分割點(diǎn),即依據(jù)每個(gè)分割點(diǎn)將總體人群分為兩組,Lp(a)濃度小于等于分割點(diǎn)組和Lp(a)濃度大于分割點(diǎn)組。此過(guò)程我們可以通過(guò)以下
命令:
gen dilpa1=0
replace dilpa1=1 if lpadl>1
結(jié)果:
其中我們定義變量dilpa1為以L(fǎng)p(a)濃度1mg/L為分割點(diǎn)得到的二分類(lèi)變量。變量lpadl為以mg/L為單位的Lp(a)濃度??梢?jiàn),Lp(a)濃度大于1mg/L的樣本量為9179。
進(jìn)一步,我們要對(duì)所產(chǎn)生的變量dilpa1是否符合我們的要求進(jìn)行驗(yàn)證:
命令:
tabstat lpadl,stats(n min max ) by(dilpa1)
結(jié)果:
如結(jié)果所示,dilpa1=0組的lpadl最大值為1,dilpa1=1組的lpadl最小值為1.1,變量dilpa1確系以1為分割點(diǎn)得到的二分類(lèi)變量。通過(guò)以上方式,我們可以繼續(xù)連續(xù)得到分別以L(fǎng)p(a)濃度為2、3、4、……、50mg/L為分割點(diǎn)的共50個(gè)二分類(lèi)變量。
接下來(lái),將以上獲得的二分類(lèi)變量依次代入本研究中的全因素校正的Logistic回歸模型中。此處以變量dilpa1為例,演示在總體人群中,以dilpa1=0為參照,dilpa1=1組對(duì)T2DM發(fā)病的OR值及其95%置信區(qū)間。
命令:
logistic DM_CAD i.dilpa1age nsex i.ndrinking i.nsmoking group01 nhypertension nischemicbd nbleedingbdnbmi ntg hdlc ldlc year nalb ncr
結(jié)果:
如結(jié)果所示,我們可以得到以L(fǎng)p(a)濃度1mg/L為分割點(diǎn)時(shí),相對(duì)小于等于1mg/L組,濃度大于1mg/L組的OR值及其95%置信區(qū)間。其中,變量DM_CAD=0代表既無(wú)糖尿病也無(wú)冠心病組;DM_CAD=1代表單純患糖尿病組。
通過(guò)依次代入連續(xù)的不同分割點(diǎn)的二分類(lèi)變量,我們最終可獲得50個(gè)對(duì)應(yīng)的OR值及其95%置信區(qū)間。筆者將其整理為STATA數(shù)據(jù),此處以“l(fā)ist”命令將其列出。
命令:
list
結(jié)果:
最后,我們將不同Lp(a)濃度分割點(diǎn)在T2DM的發(fā)病中的OR值及其95%置信區(qū)間,以類(lèi)似動(dòng)作電位描記的形式,以圖形給出其整體變化趨勢(shì)。
命令:
graph twoway rcap uci lcidilpax ,lcolor(green) || scatter or dilpax, mcolor(red) msymbol(square) msize(1) yline(1,lcolor(black))
結(jié)果:
由圖形可以直觀(guān)地看出,隨著不同Lp(a)濃度節(jié)點(diǎn)的變化,T2DM發(fā)病風(fēng)險(xiǎn)并無(wú)明顯的趨勢(shì)變化,即無(wú)閾值效應(yīng)存在。
趨勢(shì)檢驗(yàn)是對(duì)醫(yī)學(xué)研究中反應(yīng)等級(jí)或劑量反應(yīng)關(guān)系資料進(jìn)行假設(shè)檢驗(yàn)的一種方法,屬于卡方檢驗(yàn)的范疇。它主要用來(lái)檢驗(yàn)危險(xiǎn)因素在病例-對(duì)照研究中兩組等級(jí)資料構(gòu)成之間的差別是否具有顯著性,以及兩組變量間有無(wú)相關(guān)關(guān)系等,從而確定其可能存在等級(jí)關(guān)系的趨勢(shì),為進(jìn)一步分析劑量反應(yīng)關(guān)系提供依據(jù)[3]。趨勢(shì)檢驗(yàn)法是美國(guó)Breslow教授于1980年首先提出來(lái)的[4],并主要用于流行病學(xué)研究中危險(xiǎn)因素暴露水平與發(fā)病趨勢(shì)的檢驗(yàn)。
同樣地,在病例對(duì)照研究的Logistic回歸分析中,等級(jí)變量通常以啞變量的形式進(jìn)入模型進(jìn)行擬合估計(jì),默認(rèn)的情況下,以變量的最低等級(jí)水平作為參照,從而得出其他不同等級(jí)水平相對(duì)于該水平的相對(duì)風(fēng)險(xiǎn)比。在判斷隨著變量等級(jí)的變化,發(fā)病風(fēng)險(xiǎn)是否也具有趨勢(shì)性改變(趨勢(shì)檢驗(yàn))時(shí),我們可直接將等級(jí)變量直接以連續(xù)變量的形式進(jìn)行計(jì)算,以此得出的相對(duì)應(yīng)的P值,即為趨勢(shì)檢驗(yàn)的結(jié)果。
此處筆者仍以上述研究中CCSSSCC數(shù)據(jù)集為例,對(duì)趨勢(shì)檢驗(yàn)的過(guò)程稍作演示。繼續(xù)對(duì)連續(xù)性變量lpadl10進(jìn)行分組,探討隨Lp(a)濃度分組的變化,T2DM發(fā)病相對(duì)風(fēng)險(xiǎn)的變化趨勢(shì)。
首先,如該研究中所描述,我們需要對(duì)既無(wú)糖尿病也無(wú)冠心病組(DM_CAD=0)的Lp(a)濃度進(jìn)行十分位處理,可以通過(guò)以下命令獲得具體的Lp(a)分割點(diǎn)濃度值。
命令:pctilep_lpadl=lpadl10 if DM_CAD==0,nq(10)
結(jié)果:
如結(jié)果所示,通過(guò)對(duì)DM_CAD=0組的變量lpadl10進(jìn)行十分位處理,我們獲得返回值變量p_lpadl,即具體的分割點(diǎn)數(shù)值。此處變量lpadl0代表以單位mg/dl表示的Lp(a)濃度。
接下來(lái),我們通過(guò)以上獲得的分割點(diǎn)數(shù)值將總體人群分為10組。
命令:
rename p_lpadl class
xtile catelpa10=lpadl10,cutpoints(class)
通過(guò)以上命令,我們可以得到一個(gè)十分類(lèi)等級(jí)變量catelpa10,即以DM_CAD=0組的Lp(a)濃度水平,將總體人群分為10組。
同樣,我們需對(duì)獲得的該十分類(lèi)等級(jí)變量catelpa10進(jìn)行驗(yàn)證。
命令:
tabstat lpadl10,stats(n min max) by(catelpa10)
結(jié)果:
由結(jié)果可以看出,變量catelpa10各組中的最大值均與上述分割點(diǎn)相一致,變量符合要求。
將變量catelpa10以啞變量的形式代入全因素校正的Logistic回歸模型中,得出在總體人群中以L(fǎng)P(a)濃度最低組為參照,其他Lp(a)濃度分組對(duì)T2DM發(fā)病的OR值及其95%置信區(qū)間。
命令:
logistic DM_CAD i.catelpa10 age nsex i.ndrinking i.nsmoking group01nhypertension nischemicbd nbleedingbd nbmi ntg hdlc ldlc year nalb ncr
結(jié)果:
圖中紅色標(biāo)注部分即為以L(fǎng)P(a)濃度最低組為參照,其他Lp(a)濃度分組對(duì)T2DM發(fā)病的OR值及其95%置信區(qū)間。筆者對(duì)以上結(jié)果進(jìn)行整理,此處以圖形的方式給出,具體如下:
單純從圖形即可直觀(guān)地看出,經(jīng)全因素校正后,在總體人群中隨著Lp(a)濃度的遞增,T2DM的發(fā)病風(fēng)險(xiǎn)呈穩(wěn)定波動(dòng),并無(wú)明顯的變化趨勢(shì)。
最后將變量catelpa10以連續(xù)變量的形式代入全因素校正的Logistic回歸模型,在總體人群中,計(jì)算出的相應(yīng)P值即為隨著Lp(a)濃度分組的變化,T2DM發(fā)病風(fēng)險(xiǎn)的趨勢(shì)檢驗(yàn)結(jié)果。
命令:
logistic DM_CAD catelpa10 age nsex i.ndrinking i.nsmoking group01 nhypertension nischemicbd nbleedingbd nbmi ntg hdlc ldlc year nalb ncr
結(jié)果:
圖中紅色標(biāo)注部分即為趨勢(shì)檢驗(yàn)結(jié)果的P值。P=0.479,無(wú)統(tǒng)計(jì)學(xué)意義。
首先,如該研究中所描述,我們需要對(duì)既無(wú)糖尿病也無(wú)冠心病組(DM_CAD=0)的Lp(a)濃度進(jìn)行十分位處理,可以通過(guò)以下命令獲得具體的Lp(a)分割點(diǎn)濃度值。
命令:pctilep_lpadl=lpadl10 if DM_CAD==0,nq(10)
結(jié)果:
如結(jié)果所示,通過(guò)對(duì)DM_CAD=0組的變量lpadl10進(jìn)行十分位處理,我們獲得返回值變量p_lpadl,即具體的分割點(diǎn)數(shù)值。此處變量lpadl0代表以單位mg/dl表示的Lp(a)濃度。
接下來(lái),我們通過(guò)以上獲得的分割點(diǎn)數(shù)值將總體人群分為10組。
命令:
rename p_lpadl class
xtile catelpa10=lpadl10,cutpoints(class)
通過(guò)以上命令,我們可以得到一個(gè)十分類(lèi)等級(jí)變量catelpa10,即以DM_CAD=0組的Lp(a)濃度水平,將總體人群分為10組。
同樣,我們需對(duì)獲得的該十分類(lèi)等級(jí)變量catelpa10進(jìn)行驗(yàn)證。
命令:
tabstat lpadl10,stats(n min max) by(catelpa10)
結(jié)果:
由結(jié)果可以看出,變量catelpa10各組中的最大值均與上述分割點(diǎn)相一致,變量符合要求。
將變量catelpa10以啞變量的形式代入全因素校正的Logistic回歸模型中,得出在總體人群中以L(fǎng)P(a)濃度最低組為參照,其他Lp(a)濃度分組對(duì)T2DM發(fā)病的OR值及其95%置信區(qū)間。
命令:
logistic DM_CAD i.catelpa10 age nsex i.ndrinking i.nsmoking group01nhypertension nischemicbd nbleedingbd nbmi ntg hdlc ldlc year nalb ncr
結(jié)果:
圖中紅色標(biāo)注部分即為以L(fǎng)P(a)濃度最低組為參照,其他Lp(a)濃度分組對(duì)T2DM發(fā)病的OR值及其95%置信區(qū)間。筆者對(duì)以上結(jié)果進(jìn)行整理,此處以圖形的方式給出,具體如下:
單純從圖形即可直觀(guān)地看出,經(jīng)全因素校正后,在總體人群中隨著Lp(a)濃度的遞增,T2DM的發(fā)病風(fēng)險(xiǎn)呈穩(wěn)定波動(dòng),并無(wú)明顯的變化趨勢(shì)。
最后將變量catelpa10以連續(xù)變量的形式代入全因素校正的Logistic回歸模型,在總體人群中,計(jì)算出的相應(yīng)P值即為隨著Lp(a)濃度分組的變化,T2DM發(fā)病風(fēng)險(xiǎn)的趨勢(shì)檢驗(yàn)結(jié)果。
命令:
logistic DM_CAD catelpa10 age nsex i.ndrinking i.nsmoking group01 nhypertension nischemicbd nbleedingbd nbmi ntg hdlc ldlc year nalb ncr
結(jié)果:
圖中紅色標(biāo)注部分即為趨勢(shì)檢驗(yàn)結(jié)果的P值。P=0.479,無(wú)統(tǒng)計(jì)學(xué)意義。
2. 趨勢(shì)檢驗(yàn)中的分組問(wèn)題
以上即為趨勢(shì)檢驗(yàn)的實(shí)例演示,然而在實(shí)際操作中,筆者最大困惑的是連續(xù)性變量的分組位數(shù)問(wèn)題,目前對(duì)于該如何對(duì)連續(xù)性變量進(jìn)行分組,進(jìn)而以分類(lèi)變量的形式進(jìn)一步進(jìn)行趨勢(shì)研究尚無(wú)明確的要求。文獻(xiàn)中各個(gè)研究亦沒(méi)有給出分組方案的緣由和依據(jù)。筆者認(rèn)為,在保證單組樣本量足夠的情況下,盡可能多得分組可更直觀(guān),更準(zhǔn)確得反映趨勢(shì)變化,并得出更真實(shí)的趨勢(shì)檢驗(yàn)結(jié)果。
我們知道,對(duì)于趨勢(shì)檢驗(yàn),要求等級(jí)變量有三組或三組以上才可以執(zhí)行。在分組較少的情況下,單獨(dú)一組的風(fēng)險(xiǎn)水平對(duì)整體的趨勢(shì)判斷占有很大的權(quán)重,尤其是最后一組。由于受組中事件數(shù)即發(fā)病率的影響,某一組也有可能會(huì)產(chǎn)生隨機(jī)結(jié)果,如若該組在趨勢(shì)檢驗(yàn)中起到?jīng)Q定性作用,所得出的趨勢(shì)檢驗(yàn)結(jié)果也就是隨機(jī)的。如圖3中,最后一組的發(fā)病風(fēng)險(xiǎn)OR值及其置信區(qū)間(紅色或者綠色)很大程度上決定了對(duì)整體趨勢(shì)的定義。因此,減小單組結(jié)果在趨勢(shì)檢驗(yàn)中的影響權(quán)重至關(guān)重要。而我們所能想到的最簡(jiǎn)單的方法,就是增加分組的位數(shù)。然而,增加分組必定會(huì)導(dǎo)致單組中樣本量的減少,其組內(nèi)事件數(shù)亦會(huì)減少,這又會(huì)增加單組出現(xiàn)隨機(jī)結(jié)果的概率。因而又似乎是矛盾的。所以筆者得出結(jié)論,即在保證單組樣本量的情況下盡可能得增加分組位數(shù)。這就又涉及到另一個(gè)關(guān)鍵的問(wèn)題,即樣本是多少時(shí)才能“保證”樣本量呢?筆者翻閱了大量的文獻(xiàn)也沒(méi)有找出合適的答案,可能這就是醫(yī)學(xué)統(tǒng)計(jì)學(xué)壁壘中缺少的一磚。有這個(gè)漏洞的存在,沒(méi)有依據(jù),分組也就會(huì)顯得缺乏自信。依據(jù)經(jīng)驗(yàn)主義,筆者認(rèn)為,對(duì)于單組樣本量的合適與否,我們可以通過(guò)由其計(jì)算出的點(diǎn)估計(jì)值的95%置信區(qū)間的形態(tài)去判定。即確保各單組95%置信區(qū)間的形態(tài)合理和正常。
圖3
例如,在中國(guó)漢族人群中血清Lp(a)和T2DM的相關(guān)性的研究中,筆者對(duì)血清Lp(a)濃度做了十分位處理(圖4,其中對(duì)T2DM的點(diǎn)估計(jì)以黑色正方形表示,對(duì)CAD的點(diǎn)估計(jì)以黑色三角形表示)[2]。相對(duì)于Ding Lin等對(duì)Lp(a)進(jìn)行四分位的研究[5],多位分組使我們可以獲得更多的點(diǎn)估計(jì),削弱單組結(jié)果對(duì)整體趨勢(shì)的影響。通過(guò)圖4我們可以看出,在整體人群(Total)中,盡管經(jīng)十分位處理,單組中無(wú)論是對(duì)T2DM還是對(duì)CAD的點(diǎn)估計(jì)所得的95%置信區(qū)間均未出現(xiàn)形態(tài)上的異變,也就是說(shuō)保障了單組中樣本量的充足。但是在對(duì)性別的分層后,由于單組樣本量的減少,各組對(duì)應(yīng)的95%置信區(qū)間增大,由于男性人群無(wú)論在T2DM還是在CAD中,其事件數(shù)均比女性要多,其對(duì)應(yīng)點(diǎn)估計(jì)的95%置信區(qū)間總體形態(tài)仍可接受,但在女性人群中就顯得差強(qiáng)人意了。由此,分組時(shí)保證單組中樣本量充足的重要性可見(jiàn)一斑亦。由圖形即可直觀(guān)得看出,隨著血清Lp(a)濃度等級(jí)的增加,T2DM的發(fā)病風(fēng)險(xiǎn)基本上毫無(wú)變化,即無(wú)趨勢(shì)可言,通過(guò)統(tǒng)計(jì)學(xué)計(jì)算也得出相同的結(jié)論。而CAD的發(fā)病風(fēng)險(xiǎn)總體上呈上升趨勢(shì)。而Ding Lin等的研究中[5],對(duì)于血清Lp(a)濃度對(duì)T2DM的患病風(fēng)險(xiǎn),在總體人群的全因素校正模型中,相對(duì)于第1四分位(1.00),第2,3,4四分位的相對(duì)風(fēng)險(xiǎn)比OR值及95%置信區(qū)間分別為:0.86(0.73-1.01),0.88(0.75-1.04),0.76(0.64-0.90)。我們可以看到,實(shí)際上,以上數(shù)值與我們十分位中的前四分位十分相似,由于不同分組中事件數(shù)的不同,模型估計(jì)所得的相對(duì)風(fēng)險(xiǎn)比在不同分組中本身就會(huì)存在波動(dòng),如果單純就以上數(shù)值的趨勢(shì)去估計(jì)整體的變化趨勢(shì),的確缺少說(shuō)服力,有可能進(jìn)行多位分組后這種趨勢(shì)就會(huì)消失,就會(huì)得出與我們相一致的結(jié)果。
圖4
由此,筆者重申自己的觀(guān)點(diǎn),對(duì)于趨勢(shì)檢驗(yàn),在保證單組樣本量的前提下,我們需要盡可能得增加分組位數(shù),這樣才可使趨勢(shì)檢驗(yàn)的結(jié)果更加顯著和準(zhǔn)確。至于對(duì)樣本量的具體要求,還需要進(jìn)一步的統(tǒng)計(jì)學(xué)求證探討。同時(shí),這也對(duì)我們研究的總體樣本量提出了相應(yīng)的要求,大數(shù)據(jù)時(shí)代的到來(lái)也需要我們以更新更好的姿態(tài)去迎接。
以上就是筆者在臨床病例-對(duì)照研究中的些許體會(huì)和見(jiàn)解,在此與大家分享。面對(duì)數(shù)據(jù)分析,相信每個(gè)人都曾有過(guò)困惑和無(wú)奈,通過(guò)不斷地發(fā)現(xiàn)問(wèn)題和解決問(wèn)題,我們相濡以沫共同成長(zhǎng),希望我所經(jīng)歷的對(duì)你有所幫助。
參考文獻(xiàn):
[1]Mora S,Kamstrup PR, Rifai N, et al. Lipoprotein(a) and risk of type 2 diabetes. ClinChem, 2010, 56(8): 1252-1260.10.1373/clinchem.2010.146779
[2]Liu C,Xu MX, He YM, et al. Lipoprotein (a) is not significantly associated with type2 diabetes mellitus: cross-sectional study of 1604 cases and 7983 controls.Acta Diabetol, 2017.10.1007/s00592-017-0965-2
[3]楊樹(shù)勤. 衛(wèi)生統(tǒng)計(jì)學(xué)第3版. 人民衛(wèi)生出版社, 1993,76:
[4]BreslowNE, Day NE. Statistical methods in cancer research. Volume I - The analysis ofcase-control studies. IARC Sci Publ, 1980, (32): 5-338
[5]Ding L,Song A, Dai M, et al. Serum lipoprotein (a) concentrations are inverselyassociated with T2D, prediabetes, and insulin resistance in a middle-aged andelderly Chinese population. J Lipid Res, 2015, 56(4):920-926.10.1194/jlr.P049015
推薦圖書(shū)
超人氣專(zhuān)家加盟作者團(tuán)隊(duì),覆蓋“統(tǒng)計(jì)學(xué)趣談”“統(tǒng)計(jì)軟件實(shí)戰(zhàn)”“大數(shù)據(jù)與科研”“數(shù)據(jù)縱橫” 四大專(zhuān)題,暢銷(xiāo)書(shū)《傻瓜統(tǒng)計(jì)學(xué)》姊妹篇《聰明統(tǒng)計(jì)學(xué)》正式面世。
如果您長(zhǎng)期關(guān)注某一個(gè)醫(yī)學(xué)領(lǐng)域,對(duì)醫(yī)學(xué)相關(guān)事件、臨床研究等有獨(dú)到的觀(guān)點(diǎn),并愿意在較長(zhǎng)的一段時(shí)間內(nèi),與AME共同成長(zhǎng),供給我們“營(yíng)養(yǎng)”,就給我們發(fā)email吧。
微信號(hào)文章投稿聯(lián)系方式:
E-mail:weixin@amegroups.com
來(lái)稿請(qǐng)注明“微信號(hào)文章投稿”,并請(qǐng)?zhí)峁┳髡邌挝?、?lián)系電話(huà)等信息。
1.《CASE-CONTROL研究中閾值效應(yīng)及趨勢(shì)檢驗(yàn)》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀(guān)點(diǎn),與本網(wǎng)站無(wú)關(guān),侵刪請(qǐng)聯(lián)系頁(yè)腳下方聯(lián)系方式。
2.《CASE-CONTROL研究中閾值效應(yīng)及趨勢(shì)檢驗(yàn)》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來(lái)源地址,http://f99ss.com/fangchan/8922.html