Uploaded by 张景瑞

限制性立方样条在非线性关联分析中的应用

advertisement
中华儿科杂志 2020 年 8 月第 58 卷第 8 期
·652·
[19]
[20]
cystic fibrosis[J]. J Cyst Fibros, 2019, 18(4): e31⁃e36. DOI:
10.1016/j.jcf.2019.02.002.
Agarwal R, Gupta D, Aggarwal AN, et al. Clinical significance
of hyperattenuating mucoid impaction in allergic
bronchopulmonary aspergillosis: an analysis of 155 patients[J].
Chest, 2007, 132(4):1183⁃1190. DOI: 10.1378/chest.07⁃0808.
Cohen⁃Cymberknoh M, Blau H, Shoseyov D, et al. Intravenous
monthly pulse methylprednisolone treatment for ABPA in
patients with cystic fibrosis[J]. J Cyst Fibros, 2009, 8(4):
253⁃257. DOI: 10.1016/j.jcf.2009.04.008.
[21]
[22]
Chin J Pediatr,August 2020, Vol. 58, No. 8
Thomson JM, Wesley A, Byrnes CA, et al. Pulse intravenous
methylprednisolone for resistant allergic bronchopulmonary
aspergillosis in cystic fibrosis[J]. Pediatr Pulmonol, 2006,
41(2):164⁃170. DOI: 10.1002/ppul.20333.
Jat KR, Walia DK, Khairwa A. Anti⁃IgE therapy for allergic
bronchopulmonary aspergillosis in people with cystic fibrosis
[J]. Cochrane Database Syst Rev, 2018, 3: CD010288. DOI:
10.1002/14651858.CD010288.pub4.
(收稿日期:
2020⁃04⁃26)
(本文编辑:
苗时雨
李伟)
·临床研究方法学园地·
限制性立方样条在非线性关联分析中的应用
王晓晓 陶立元 李楠 赵一鸣
北京大学第三医院临床流行病学研究中心 100191
通信作者:
赵一鸣,
Email:
yimingzhao115@163.com
基金项目:国家自然科学基金(81701067)
DOI:10.3760/cma.j.cn112140⁃20200615⁃00621
医学研究常需要通过线性回归、Logistic 回归、Cox 回归
探讨连续自变量和因变量的关系,但上述模型通常要求通
(survival),library(rms), data<⁃read. csv("data. csv"),
ddist<⁃datadist(data),options(datadist= ′ ddist′ ),fit<⁃cph
过合适的链接函数,保证自变量和因变量服从线性关系。
(Surv(time,status)~rcs(X,5),data=data),
(an<⁃anova
然而,上述假设不成立时需要采用合适的方法探讨自变量
(fit)),plot(Predict(fit,fun=exp),anova=an,pval=TRUE,
和因变量是否存在非线性关联。限制性立方样条
(restricted cubic spline,
RCS)是最常用的一种方法。
RCS 实质上是对自变量的一种转换,首先通过选择节
点的位置和数量 K,
拟合样条函数 RCS(X),
使得连续变量 X
ylab=“Hazard ratio”
)。若因变量为二分类或连续变量,改用
lrm 函数拟合模型即可,fit<⁃lrm(Y~rcs(X,5),data=data)。
点击(an<⁃anova(fit))可得到自变量 X 和因变量非线性关联
的检验结果,点击 plot 即可得到自变量 X 和效应量 HR 关系
在整个取值范围内呈现光滑的曲线。样条函数 RCS(X)包
的图,若非线性检验结果 P 值大于 0.05,则提示自变量和 X
β1S1 +…+β(k⁃2)S(k⁃2)。其中,节点的位置对样条函数的拟合影
P 值小于 0.05,则提示自变量和因变量的关系呈现非线性。
括一个线性项 X 以及 K-2 个立方项(S),即 RCS(X)=β0X+
的关系为线性关联,采用传统方法即可;若非线性检验结果
响不大,一般根据连续变量的百分位数选择。节点数量相
此外,研究者可以在模型中引入其他自变量,探讨在调整了
对节点位置对样条函数的影响较大,节点的数量决定曲线
其他自变量的基础上,探讨目标自变量 X 和因变量是否存
的形状,当节点的数量为 2 时,得到的拟合曲线就是一条直
线。研究显示,节点数量为 3~5 时样条函数拟合较好。RCS
通过样条函数 RCS(X)转换自变量 X 后,然后根据因变量的
分布类型选择合适的链接函数,进而拟合模型 g(Y)=常数
项+RCS(X)+其他自变量,
其中 g 为链接函数。
目前 SAS、STATA、R 等软件都可以进行 RCS 分析。以
R 软件为例,可以通过程序包 rms 的 rcs 函数拟合样条函数
rcs(X,knots)。以生存分析数据为例,R 程序如下:library
在非线性关联,模型中加入其他自变量即可,fit<⁃cph(Surv
(time,status)~rcs(X,5)+其他自变量)。研究者也可以同
时探讨几个自变量是否和因变量存在非线性关联,在模型
中加入多个自变量的样条函数即可,fit<⁃cph(Surv(time,
status)~rcs(X,5)+rcs(X2,
5)+其他自变量)。
(收稿日期:
2020⁃06⁃15)
(本文编辑:
孙艺倩)
Q2xvdWRWZXJzaW9uLQo?
Download