Uploaded by lion qin

SDTMIG学习总结

advertisement
CDISC SDTM IG 学习笔记
学习心得:
SDTM 数据集与一般数据集的区别:
1. 数据集个数不同
按照数据变量的不同来源分为不同的域,而一般的临床试验只有一个或少量
几个数据集。
也就是数据不是按照在 CRF 表中的位置来收集的,而是按不同 topic。
2. 个人记录与事件记录
一般数据集每个人一条记录,SDTM 数据集每个人的每个事件、每次用药或
每次不良反应一条记录。变量的数量减少,记录的条数增多。也就意味着每
个受试者每次访视每个时间点可能有许多条观测记录。
3. 由于变量之间存在关联,所以 SDTM 有关联数据集
4. CDISC 的重点是如何确定记录的唯一性,比如多阶段多时间多剂量的试验,
就需要有三个变量来区别。
5. 元数据:关于数据的数据,按照一定的标准,从信息资源中抽取出相应的特
征,组成一个特征元素集合。包括描述一个具体对象所需要的数据项集合、
各项数据语义定义、规则和语法定义。元数据标准的制定为提高数据库建库
质量,使诗句加工达到规范化、标准化,促进科学数据标准化,加强数据交
流。
6. 作用:变量名标准化,变量取值标准化
7. 并不是所有的域和变量都要使用,根据研究内容来选择
This model describes the contents and structure of data collected during a clinical
trial
The purpose is to provide regulatory authority reviewers (FDA) a clear description of
the structure, attributes and contents of each dataset and variables submitted as
part of a product application
1. 域
1.1 定义:一组具有共同主题并在逻辑上相关的观测结果集合。A domain is
defined as a collection of observations that share a common topic.
每个域采用唯一的两字符(英文缩写)代码加以区别,如不良时间域(AE,
Adverse Event)
域是 SDTM 的核心,所有变量按不同的来源被分类到相关的域。比如下图中
展示提交的 SAS 数据集。CM(concomitant and prior medication)伴随用药域、
DA(Drug Accountability)药物发放回收记录域和 DM(DEMOGRAPHICS)人口学
资料域等。
⚫
域名和变量名是固定不能变的。在所有域中使用 SDTM 规定的变量标签
⚫
研究中只需提交实际采集的域,具体采集哪些数据由研究内容决定,而
不是基于 SDTM。
⚫
扩展内容:如果现有的域不能满足要求,可以创建自定义域(相关内容
未包括)
1.2 域模型
1.2.1 域可以分为五类
Special-Purpose Domains
General Observation Class(3 种 Interventions,Events, Findings),
Finding about,
Trial Design
Relationship Datasets。
下图是 SDTM vesion3.2 中包括的所有域。
COVAL
ETCD
SUBJID
VISITNUM
---TRT
--TERM
--TEST
FATESTCD
1.2.2 域模型假设
变量名最长为 8 个字符
变量筛选:每个域中有各种变量,研究者应按需要选择合适的变量。域中的变量
按照需求的不同可分为必需变量(域中必须有且值不能为空)、预期变量(域中
必须有但可以为空值)和许可变量(有数据才提交)
变量顺序:对于 General Observation Class 中的变量顺序,应先按标识变量、主
题变量、修饰语变量到时间变量依次排列,每种变量类型内按照 SDTM 表中变量
描述排序。
扩展内容:域可以被分割,如将调查量表 QS 域分为临床整体印象(QSCG)、痴
呆易于康奈尔量表(QSCS)和细微精神状况检查(QSMM),操作方法不详述。
受试者:在标签或注释中将“病人”或“志愿者”统称为“受试者”。在所有的
域数据集中都应该包含唯一的标示符(USUBJID)。一般可用:研究编号、临床中
心编号和受试者编号联接起来作为 USUBJID。
文本数据大小写:建议大写文字形式递交文本数据(如果是英文的话),长文本
或标签文本及已经是大小写的受控术语除外。
缺失值:单个数据项缺失以空来表示,如果有—STAT 变量和—REASND 变量则还
需在—STAT 中录入 NOT DONE,在—REASND 中录入原因。
分类变量:——CAT、——SCAT、——GRPID、——SPID、——REFID
——CAT 与——SCAT 在采集之前就已知,是固有属性,用于受试者之间分组
——GRPID 通常在数据采集之后由申办者指定,受试者之内分组数据
对各受试者之间具有相同值的数据用——CAT 与——SCAT,而对受试者之间具有
不同值时用——GRPID
自由文本:其他,请说明。P36 页
一个变量的多个取值
受控术语:一个星号*或两个星号**代表相应的变量应该被填入意义明确的一组
数值(受控术语)。一个星号表示受控术语来自申办者自定义的值,两个星号表
示来自外部已出版的数据源。
⚫
建议受控术语应大写,除了本来就是小写的或计量单位
⚫
放入 define.xml
⚫
不能用数字代码
每个通用观察域必须要有一个主题变量,一个时间变量
主题变量:事件类——TERM,干预类——TRT,发现类——TEST;必须有受控术
语
时间变量:国际标准日期时间格式 ISO 8601
YYYY—MM—DDThh:mm:ss
年—月—日 T 小时:分钟:秒
0 不能省略,不能有空格。
时间变量的片段名为——DTC。
⚫
时间成分缺失:恰当右缺失
中间缺失补充单个连字符。
不确定时间的表示
时间间隔变量——DUR
YYYY—MM—DDThh:mm:ss/ YYYY—MM—DDThh:mm:ss
或者 PnYnMnDTnHnMnS 或 PnW
确定开始时间和间隔
YYYY—MM—DDThh:mm:ss/PnYnMnDTnHnMnS
确定结束时间和间隔
PnYnMnDTnHnMnS/YYYY—MM—DDThh:mm:ss
⚫
研究日变量——DY
——DY=(——DTC 的日期部分)-(RFSTDTC 的日期部分)+1,如果——DTC
和 RFSTDTC 相同或在其后
——DY=(——DTC 的日期部分)-(RFSTDTC 的日期部分)+1,如果——DTC
在 RFSTDTC 之前
⚫
访视
对于非计划中的访视:VISITNUM 值
⚫
相关时间变量
——STRF 和——ENRF 是分别与 RFSTDTC 和 RFENDTC 比较,可能的值是
BEFORE,DURING,DURING/AFTER,AFTER,ONGOING,U(Unknown)等
——STTPT 参考的开始时间点,——STRTPT 表示与——STTPT 相比较
⚫
任何域的日期都应该记录在——DTC
数据标准化
——ORRES 记录原始结果,但——STAT 为“未检测”或来源为衍生(——DRVFL=
“是”)时,它可以为空。
——ORRES 有值时,字符型变量——STRESC 必须有值,——STRESC 可以由——
ORRES 转换而来,也可以是根据——ORRES 值指定的相应值
然后将——STRESC 中的值转入数值型变量——STRESN
如果原始数据中含有字符,如<,>等,则字符应该复制到——STRESC 中,而—
—STRESN 则为空。
未测项目
CRF 表中数据缺失,且没有对选项是/否或已测/未测作出明确选择时
如果一组检测项目未作,则相应的变量值为:
——TESTCD 为——ALL;
——TEST 应为《模块名称》
——CAT 应为测试组的名称
——ORRES 为空
——STAT 为未测
——REASND 如果采集了,可能是标本遗失
⚫
心电图的总体解释作为一条新纪录显示
——TEST 不能超过 40 字符,如果超过了,可以提供其在电子 CRF 的链接;如果
CRF 表中没有,则创建一个 pdf 文档来储存全部文本描述。
⚫
超过 200 字符的文本,前 200 字符存储在标准域变量里,剩下的每 200 字符
应该在 SUPP——中存储为一条记录。变量名是在原始的标准域变量名称后
面添加一个从 1 开始一位的整数,如果变量名已经到了 8 个字符,则最后一
个字符用该数字替代。
1. 人口学数据域 Demographics DM
每个受试者一条记录,DM 域 includes essential standard variables of each subject
必需变量:STUDYID, DOMAIN, USUBJID, SUBJID, SITEID, SEX, ARMCD, ARM,
COUNTRY
预期变量:RFSTDTC, RFENDTC, AGE, AGEU
许可变量:INVID, INVNAM, BIRTHDTC, RACE, ETHNIC, DMDTC, DMDY
变量说明
STUDYID:研究唯一标示符
DOMAIN:域名 DM
USUBJID:受试者唯一标示符,可以是 STUDYID-SITEID-SUBJID 组成
SUBJID:受试者编号
SITEID:研究中心编号
SEX:性别 受控术语 F(Female), M(Male), U(Unknown), UNDIFFERENTATED
ARMCD:最长 20 字符,计划分组代码
ARM:计划分组描述
COUNTRY:国家 受控术语 C66785 各国英文缩写,如中国 CHN
RFSTDTC:受试者第一次暴露于研究治疗的日期/时间
RFENDTC:受试者结束试验的日期/时间,常等于最后一次暴露于研究治疗的日
期/时间
AGE:年龄
AGEU:年龄单位 受控术语 DAYS HOURS MONTHS WEEKS YEARS
INVID:研究者标识符,如果 SITEID 等于 INVID(一个中心一个研究者)则不需要
INVNAM:研究者姓名
BIRTHDTC:出生日期/时间
RACE:人种 受控术语 AMERICAN INDIAN OR ALASKA NATIVE/ASIAN/BLACK OR
AFRICAN AMERICAN/NATIVE HAWAIIAN OR OTHER PACIFIC ISLANDER/WHITE
ETHNIC:族裔 受控术语 HISPANIC OR LATINO/NOT HISPANIC OR LATINO/NOT
REPORTED/UNKNOW
DMDTC:采集日期
DMDY:采集数据研究日
如果 DMDTC≥RFSTDTC,则 DMDY=DMDTC-RFSTDTC+1
如果 DMDTC<RFSTDTC,则 DMDY=DMDTC-RFSTDTC
⚫
每个受试者只提交一条 DM 记录
⚫
ARM/ARMCD 的值必须与实验分组的数据集(TA)的一致
如果需要递交筛选失败的受试者数据,应把他们放入 DM 域中,
ARMCD=SCRNFALL;ARM=筛选失败。还可在 Disposition 实施情况域(DS)中
放入一条记录标明筛选失败发生的时间。
如果没有筛选失败,但也没有分配到任何分组,则 ARMCD=NOTASSGN;ARM=
未分配。
⚫
受试者水平的受试人群标志(如 COMPLT,SAFETY,ITT 和 PPROT 等)可放入补
充修饰数据集 SPPDM。
⚫
如果是混血人种,则 RACE 为 MULTIPLE,具体人种情况放入 SUPPDM。或者
也可指定一个主要人种,其余信息放入 SUPPDM。或者采用“其他,请说明”
采集自由文本信息,则 RACE 值为其他,而把具体内容放入 SUPPDM。
⚫
Safety population flag/randomized number/randomized flag???
2. 注释域 Comments CO
The Comments special-purpose domain provides a solution for submitting free-text comments related
to data in one or more SDTM domains or collected on a separate CRF page dedicated to comments.
Comments are generally not responses to specific questions; instead, comments usually consist of
voluntary, free-text or unsolicited observations.
CO域是为了提交与域数据相关的自由文本型注释,以及CRF表中专门的注释。
必需变量:STUDYID, DOMAIN, USUBJID, COSEQ, COVAL
许可变量:RDOMAIN, IDVAR, IDVARVAL, COREF, COEAL, CODTC
COSEQ:同一 USUBJID 受试者不同注释的序号
COVAL:注释的内容,超过 200 字则依次记录在 COVAL1-COVALn 中
IDVAR:父表中用于指明注释与哪个记录相关
IDVARVAL:IDVAR 的值
COREF:与注释相关的参考,如 CRF 页码
COEVAL:注释的初始作者
CODTC:注释表的注释时间/日期
⚫
CO 域的三个来源:a,与特定域或记录无关联,这种情况下 RDOMAIN, IDVAR,
IDVARVAL 值为空;b,域特定域相关联,但无关联记录,RDIMAINS 值为相关
域的代码,变量 IDVAR, IDVARVAL 为空;c,与特定记录或一组记录相关联,
RDOMAINS 为相关域代码,IDVAR 和 IDVARVAL 分别为所关联的变量名和值。
|kənˈsɒlɪdeɪt|
加强,巩固 合并,统一
The Subject Elements dataset consolidates information about the timing of each subject’s progress
3. 受试者元素表 Subject Elements SE
through the Epochs and Elements of the trial.
SE 域整合了每一受试者在试验过程中经历的各时期(Epochs)和元素(Elements)
的时间信息。受试者在试验中的实际经历,
而试验设计相关的 TA(Trial Arm)或 TE(Trial Elements)域中是设计的时期和元
素,并不一定是实际的。
必需变量:STUDYID, DOMAINS, USUBJID, SESEQ, ETCD, SESTDTC
预期变量:SEENDTC
许可变量:ELEMENT, TAETORD, EPOCH SEUPDES
ETCD:ELEMENT 的伴随变量,8 字符以内。如果受试者实际经历的元素与计划不
同,被视为新元素,ETCD=UNPLAN
ELEMENT:元素的名称,如果 ETCD=UNPLAN,则为空值
SESTDTC:元素开始日期/时间
SEENSTC:元素结束日期/时间
TAETORD:受试者被分配组别内元素计划序号
EPOCH:与受试者所分配组内的计划元素序列相关联元素的时期
SEUPDES:非计划元素描述
⚫
强烈建议递交受试者元素数据集
⚫
根据定义,元素的结束日期 SEENDTC 值将和下一个元素的开始日期 SESTDTC
相同
⚫
SE 域与其他域不同,SESTDTC 是必需变量,不能为空
4. 受试者访视域 Subject Visit SV
The Subject Visits dataset provides reviewers with a summary of a subject’s Visits. Comparison of an
individual subject’s SV dataset with the TV dataset which describes the planned Visits for the trial,
quickly identifies missed Visits and “extra” Visits.
受试者访视域是关于受试者访视时间,综合了分散在其他包含访视变量的域中的
信息。SV 域记录的是受试者实际的访视情况,而 TV(Trial Visit)域则记录的是
计划中的访视。
必需变量:STUDYID, DOMAIN, USUBJID, VISITNUM
预期变量:SVSTDTC, SVENDTC
许可变量:SVSTDY, SVENDY, SVUPDES
VISITNUM:访视编号,用于排序;小数可用于插入非计划访视
VISIT:访视名称
VISITDY:计划访视研究日
SVSTDY:访视开始日期相对 RFSTDTC 的研究日
SVENDY:访视结束日期相对 RFENDTC 的研究日
SVUPDES(description of unplanned visit):非计划访视描述
⚫
非计划内访视应在 SVUPDES 中记录原因,VISITNUM 用小数表示
⚫
VISITDY 是一次访视的计划的研究日,非计划访视不填
⚫
SVSTDY 是一次访视的实际的研究日,是 SVSTDTC 相对 RFSTDTC
5. 干预类
5.1 既往和伴随用药 Concomitant Medications CM
Case report form (CRF) data that captures the concomitant and prior
medications/therapies used by the subject.
必需变量:STUDYID, DOMAIN, USUBJID, CMSEQ, CMTRT
许可变量:CMGRPID, CMSPID, CMMODIFY, CMDECOD, CMCAT, CMSCAT, CMPRESP,
CMOCCUR, CMSTAT, CMREASND, CMINDC, CMCLAS, CMCLASCD, CMDOSE,
CMDOSTXT, CMDOSEU, CMDOSFRM, CMDOSFRQ, CMDOSTOT, CMDOSRGM,
CMROUTE, CMSTDTC, CMENDTC, CMSTDY, CMENDY, CMDUR, CMSTRF, CMENRF,
CMSTRTPT, CMSTTPT, CMENRTPT, CMENTPT
CMSEQ:序号
CMGRPID(Group ID):组别 ID,用来把一组在单独域中相关的记录捆在一起,
支持域内或域间关系
CMSPID(Sponsor-Defined Identifier):申办者定义的编号,比如预先打印在 CRF
表上的识别符或伴随药物的行号
CMTRT(Reported Name of Drug, Med, or Therapy):药品本名
CMMODIFY:修正的药品名,为了便于编码
CMDECOD:标准的药物名称,可从词典中得到,如 WHO Drug 受控术语
CMCAT:药物类别 受控术语
CMSCAT:药物子类 受控术语
CMPRESP(Pre-Specified):药物是否在CRF表上预设 受控术语(NY)
CMOCCUR:预设药物是否使用 受控术语(NY)
CMSTAT:如果预测药物未使用,则 CMSTAT 为 NOT DONE;如果使用则为空值
CMREASND:如果 CMSTAT 为 NOT DONE,则描述原因,否则为空
CMINDC:适应症,给与药物的原因
CMCLAS(CLASS):药物类别,受控术语
CMCLASCD(CLASS CODE):药物类别代码,受控术语
CMDOSE:每次用药剂量
CMDOSEU:剂量单位,受控术语(UNIT)
CMDOSFRM:剂型, 受控术语(FRM)
CMDOSFRQ:期间给药频率,受控术语(FRQ)
CMDOSTOT:每日总剂量
CMDOSRGM(dose regimen):计划服药方案
CMROUTE:给药途径,受控术语(ROUTE)
CMSTDTC:开始用药时间
CMENDTC:结束用药时间
CMSTDY:开始用药研究日
CMENDY:结束用药时间
CMDUR:持续时间
CMSTRF(Start Relative to Reference Period):相对于RFSTDTC,受控术语(STENRF):
AFTER/BEFOR/COINCIDENT/DURING/(DURING/AFTER)/ONGOING/UNKNOWN.
CMENRF:类似于CMSTRF,受控术语(STENRF)
CMSTTPT(Start Reference Time Point):开始参考时间
CMSTRTPT(Start Relative to Reference Time Point):相对CMSTTPT,受控术语
(STENRF)
CMENTPT(End Reference Time Point):结束参考时间
CMENRTPT(End Relative to Reference Time Point):相对CMENTPT,受控术语
(STENRF)
⚫
CMDOSFRQ=PRN 表示按需用药(As needed)
5.2 暴露 Exposure EX
The Exposure domain model records the details of a subject's exposure to
protocol-specified study treatment.
暴露域记录了受试者于试验方案定义的研究治疗的细节。
必需变量:STUDYID, DOMAIN, USUBJID, EXSEQ, EXTRT
预期变量:EXDOSE, EXDOSU, EXDOSFRM, EXSTDTC
许可变量:EXGRPID, EXSPID, EXCAT, EXSCAT, EXDOSTXT, EXDOSFRQ, EXDOSTOT,
EXDOSRGM, EXROUTE, EXLOT, EXLOC, EXTRTV, EXVAMT, EXVAMTU, EXADJ, TAETORD,
EPOCH, EXSTDTC, EXENDTC, EXSTDY, EXENDY, EXDUR, EXTPT, EXTPTNUM, EXELTM,
EXTPTREF
EXDOSRGM(Dose Regimen):计划治疗方案
EXLOT:批号
EXDIR(Directionality):给药部位
EXADJ:剂量调整原因
5.3 嗜好品使用 Substance SU
The intent of the domain is to capture substance use information that may be used
to assess the efficacy and/or safety of therapies that look to mitigate the effects of
chronic substance use.
这个域的目的是为了获取嗜好品的使用信息,可用于评估长期使用嗜好品对治疗
有效性及安全性可能存在的作用
必需变量:STUDYID, DOMAIN, USUBJID, SUSEQ, SUTRT
许可变量:若干
⚫
如果在病例报告表内嗜好品使用信息采集超过一个,那么可加入 VISITNUM
V3.2 新增 Exposure as collected EC
The Exposure as Collected domain model reflects protocol-specified study treatment
administrations, as collected.
EC 域是 EX 域的补充,记录 EX 域中没有的一些信息。
V3.2 新增 procedures PR
The Procedures domain model reflects collected details describing a subject’s
therapeutic and diagnostic procedures
•
应用条件:
I.
疾病筛查
II.
内窥镜检查
III.
诊断试验
IV.
治疗过程
V.
手术过程
6.2 不良事件 Adverse Events AE
The Adverse Events dataset includes clinical data describing "any untoward medical
occurrence in a patient or clinical investigation subject administered a
pharmaceutical product and which does not necessarily have to have a causal
relationship with this treatment" (ICH E2A).
不良事件域包括病人或临床试验受试者接受一种药品后出现的任何不良医学事
件,但不一定与治疗有因果关系。与监管部门协商后,申办者可扩展或限制不良
事件采集的范围(如与试验操作相关的治疗前发生的时间,不采集与作为疗效终
点的事件)
必需变量:STUDYID, DOMAIN, USUBJID, AESEQ, AETERM, AEDECOD
预期变量:AELLT, AELLTCD, AEPTCD, AEHLT, AEHLTCD, AEBODYSYS, AESER, AEACN,
AEREL, AESTDTC, AEENDTC
(MedDRA)中不良事件的分类变量:
AELLT/AELLTCD/AEPTCD/AEHLT/AEHLTCD/AEHLGT/AEHLGTCD
AEDECOD(Dictionary-Derived Term):字典编码事件名称 受控术语 MedDRA
AEPTCD(Preferred Term Code):最佳事件名称 受控术语 MedDRA
AEHLT(High Level Term):高级别名称受控术语 MedDRA
AEHLTCD(High Level Term Code):高级别名称编码 受控术语 MedDRA
AELLT/AELLTCD 同上
AEHLGT(High Level Group Term)受控术语 MedDRA
AEHLGTCD(High Level Group Term Code)受控术语 MedDRA
AEBODSYS:系统或器官分类,受控术语
AEBDSYCD:AEBODSYS 的编码,受控术语 MedDRA
AESOC(Primary System Organ Class):主要系统或器官,常与AEBODSYS相同
受控术语 MedDRA
AESOCCD:AESOC编码受控术语 MedDRA
AELOC:发生位置
受控术语 LOC
AESEV:严重程度 受控术语 AESEV
AESER:严重事件否? 受控术语 NY
AEACE(Action Taken with Study Treatment):不良事件对研究治疗的改变 受控术语
ACN
AEACNOTH:与研究不相关的措施
AEREL:治疗与时间是否存在因果关系 受控术语
AERELNST:是否与非研究治疗相关
AEPATT:不良事件模式(如间歇性,持续性等) 受控术语
AEOUT:不良事件结局 受控术语 OUT 死亡/未恢复或未解决/恢复或解决/以以
恢复或解决但有后遗症/正在恢复或解决/不清楚
AESCAN:与癌症相关吗? 受控术语 NY
AESCONG/AESDISAB/AESDTH/AESHOP/AESLIFE 何种后果受控术语 NY
AESOD:是否药物过量引发 受控术语 NY
AESMILE:与其他严重临床事件相关吗 受控术语 NY
AECONTRT:是否给与另一种治疗 受控术语 NY
AETOXGR:标准毒性等级
受控术语 可用 TOXGRV3
⚫
通常情况下 AESEV AETOXGR 只有一个存在
⚫
EPOCH 应是不良事件开始的时期
⚫
没有采集关于这些事件的其他数据,如果需要则记录在 FA 域
6.3 处置 Disposition DS
A subject domain utilized for the submission of information encompassing and
representing data, vocabulary or records related to disposition.
DS 域是提供参加研究所有受试者的概况,如随机、受试者完成状态或整个研究
或每个阶段或部分中止的原因,包括筛选和治疗后随访。
必需变量:STUDYID, DOMAIN, USUBJID, DSSEQ, DSTERM, DSDECOD
预期变量:DSCAT, DSSTDTC
DSDECOD:标准化的处置事件名称,受控术语 NCOMPLT
DSCAT:处置分类,受控术语 DSCAT(处置事件、方案里程碑、其他事件)
EPOCH:时期,受控术语 EPOCH
⚫
当 DSCAT 为处置事件时,DSTERM 为完成或当受试者未完成研究时则 DSTERM
记录处置事件的确切信息。
⚫
当 DSTERM 为完成时,DSDECOD 为完成,当 DSTERM 为确切信息时,DSDECOD
为需要选择受控术语,例如 DSTERM=受试者搬家对应为 DSDECOD=无法随访
⚫
当 DSCAT=方案里程碑时,DSTERM 和 DSDECOD 为相同的受控术语,如获得
知情同意或随机,此时 EPOCH 不赋值
⚫
非处置或里程碑的事件为其他时间,其原因记录在 DSTERM,如 DSTERM=研
究者失误,DSDECOD=治疗破盲
6.4
既往病史 Medical History MH
MH 域包括受试者在试验开始之前的既往病史
The medical history dataset includes the subject's prior history at the start of the
trial.
必需变量:STUDYID, DOMAIN, USUBJID, MHSEQ, MHTERM
其他变量
6.5 方案偏离 Deviation DV
DV 域是采集方案偏离的域模型
The intent of the domain is to capture protocol violations and deviations during the
course of the study and will store only those criteria violation by or deviated from by
the subject and not a response to each violation or deviation.
⚫
在受试者随机分配或第一次治疗之后发生的偏离
⚫
不包括对偏离的处理
7.6 临床事件 Clinical Events CE
是获取关注的临床事件,而不被分类为不良事件。
A dataset used to capture clinical events of interest that would not be classified as
adverse events
例如:在一个偏头痛的研究中,偏头痛可能不会被当作不良事件。此时偏头痛的
症状和体征被记录在 CE 域中。
7.7 医疗经历 Healthcare Encounters HO
The Healthcare Encounters dataset includes inpatient and outpatient healthcare
events (e.g., hospitalizations, nursing home stay, rehabilitation facility stays,
ambulatory surgery).
如:住院,康复治疗,重症监护室,心导管室等
无特殊变量
⚫
原因可计入 SUPPHO
Finding
7.8 心电图域 ECG test results EG
Findings related to the collection of ECG data, including position of the subject,
method of evaluation, all cycle measurements and all findings from the ECG
including an overall interpretation if collected or derived.
EG 域是指 CRF 上采集的心电图检查相关信息
必需变量:STUDYID, DOMAIN, USUBJID, EGSEQ, EGTESTCD, EGTEST
预期变量:EGPOS, EGORRES, EGSTRESC, EGBLFL, EGEVAL, VISITNUM, EGDTC
EGPOS:体位,受控术语 POSITION
EGTESTCD:心电图检查缩写,受控术语,EGTESTCD
EGTEST:心电图检查名称,受控术语,EGTEST
EGSTRESC:字符型标准结果,受控术语,EGSTRESC
EGXFN:心电图外部文件名和路径
EGNAM:供应商名称
EGLEAD:测量的主要部位,受控术语 LOC
EGMETHOD:心电图检查方法,受控术语 EGMETHOD
可只采集最终解释
6.9 为符合入选标准/排除标准的记录 Inclusion/Exclusion
The intent of the domain model is to only collect those criteria that cause the
subject to be in violation of the inclusion/exclusion criteria not a response to each
criterion.
CRF 采集的受试者未符合入选/排除标准的记录。所有违反入选/排除标准的情况
都保存在该数据集中。
⚫
受试者由于失误而入选的也要记录
⚫
不适用的 IE 不用记录
⚫
IE 域反应的是违反入排标准的记录,TI 数据集中记录的是 protocol 的入排标
准
⚫
该域应该记录决定某受试者是否进入该研究时(如:导入期结束时或随机化
前)受试者不符合入选/排除标准的情况,不能采集研究过程中/随机化
后/研究用药后出现的试验方案偏离/违背。 DV 域用于递交方案偏离/违背纪
录
6.3.3 实验室检查结果 LB
Laboratory test findings including, but is not limited to hematology, clinical chemistry
and urinalysis data. This domain does not include microbiology or pharmacokinetic
data, which are stored in separate domains.
LB 域存储了 CRF 采集或来自中心提供者/供应商的实验室检查数据。
必需变量:STUDYID, DOMAIN, USUBJID, LBSEQ, LBTESTCD, LBTEST
预期变量:LBCAT, LBORRES, LBORRESU, LBORNRLO, LBORNRHI, LBSTRESC, LBSTRESN,
LBSTRESU, LBSTNRLO, LBSTNRHI, LBNRIND, LBBLFL, VISITNUM, LBDTC
LBTESTCD:实验室检查的简称,受控术语 LBTESTCD
LBTESTCD:实验室检查的名称,受控术语 LBTEST
LBSTRESC:结果的标准化后,字符型,受控术语 LBSTRESC
LBORNRLO:正常范围下限
LBORNRHO:正常范围上限
LBNRIND:正常范围标志 受控术语 NRIND
LBSPEC:标准类型 受控术语 SPECTYPE
LBSPCCND:样本状况 受控术语 SPCCOND
LBMETHOD:测试或检查方法,受控术语 METHOD
LBLOINC:LOINC 代码,从字典得到
LBBLFL:基线标志 受控术语 NY
LBDRVFL:衍生标志 受控术语 NY 如其他记录的平均值,如为 Y 则 LBORRES 可
能为空
⚫
LBNRIND 记录正常范围比较结果,临床意义记录在 SUPPLB
⚫
LBTPT 为样本采集时间的描述,LBTPTREF 是参照点的描述
6.3.4 体格检查 Physical Examination PE
Findings collected during a physical examination of the subject. It has findings that
are discovered that are related to body systems. Does not include vital signs
measurements, which are stored in the vital signs domain.
该域存储了体检的发现结果。可以是身体系统检查和某体检异常的信息。
PELOC:体检异常发现部位,受控术语,LOC
PEMETHOD:测试或检查的方法,受控术语,METHOD
PEEVAL:评估人员,受控术语,EVAL
6.3.5 调查量表 Questionnaires QS
Questionnaires have a defined standard structure, format, and content; consist of
conceptually related items that are typically scored; and have documented methods
for administration and analysis.
受控术语:QSTESTCD, QSTEST, QSCAT, UNIT, EVAL
⚫
调查量表域可能包括但不限于受试者报告的结果以及验证或未经验证的调
查量表
⚫
单项得分测量或结果可以放在调查量表中(例如,APACHE 得分,ECOG)
⚫
申办方应该提供元数据中验证过的调查量表的版本信息
6.3.6 受试者特征 Subject Characters SC
SC 是与受试者相关的没有被采集到其它域中的数据。例如:受试者姓名英文首
字母、眼睛颜色、生育状况,等。
The subject characteristics domain is for data not collected in other domains that is
subject-related.
SCTESTCD:受试者特征简称,受控术语,SCTESTCD,母乳喂养、惯用手、教育情
况、工作、工资、肤色等。
SCTEST:受试者特征,受控术语,SCTEST,SCTESTCD 的全称
6.3.7 生命体征 visual sign VS
Measurements including but not limited to blood pressure, temperature, respiration,
body surface area, BMI, height and weight.
CRF 中采集的生命体征测量值,如:血压、身高、体重、脉搏、体温等测量,或
由此衍生的数据如体质指数 (BMI)。
VSTESTCD:生命特征检测简称 受控术语 VSTESTCD
VSTEST:生命特征检测名称 受控术语 VSTEST
VSPOS:受试者生命特征检测的体位,受控术语 POSITION
VSORRESU:单位,受控术语,VSRESU
VSLAT(laterity):左右,受控术语,LAT
6.3.8 药物分发记录 Drug Accountability DA
Data regarding the accountability of study drug, such as information on the receipt,
dispensing, return, and packaging.
DA 是关于研究药物收发等的数据,例如:药物的接收、分发、返回和包装的信
息。
⚫
DACAT 是申办者用于区分不同类型药物(例如:研究用药、急救用药和准备
用药等)的一种方法。
6.3.9 微生物学域 MB MS
6.3.10 药代动力学浓度 Pharmacokinetics Concentrations PC
必需变量:STUDYID, DOMAIN USUBJID, PCSEQ, PCTEST, PCTESTCD,PCSPEC
预期变量:PCORRES, PCORRESU, PCSTRESC, PCSTRESN, PCSTRESU, PCNAM, PCLLOQ,
PCULOQ, PCDTC
许可变量:若干
PCSPEC(Specimen Material Type ):标本种类(如血清、血浆)
PCSPCCND:样本状况
PCNAM:提供试验结果的实验室或供应商名称
PCLLOQ(Lower Limit of Quantitation ):量化指标的下限
PCULOQ:量化指标的上限
PCEVLINT(Evaluation Interval):评估间隔
PCTPT(Planned Time Point):样本采集时间的描述
PCTPTNUM:PCTPT 的数字版本
PCTPTREF:固定的参考时间点的名称,用来与采样时间进行比较,比如用于区
分服药前和服药后的采样
PCELTM(Elapsed Time):距离 PCTPTREF 的时间
PCRFTDTC:为 PCTPTREF 的具体时间
药代动力学参数 Pharmacokinetics parameters PP
⚫
描述 PC 数据(如曲线下面积、最大浓度和峰值时间-浓度曲线参数的数据)
⚫
所有参数的信息(如数量指数,模型加权)应在 SUPPPP 数据集中递交
6.3.11 死亡情况 Death Details DD
The domain is designed to hold supplemental data that are typically collected when a
death occurs, such as the official cause of death. It does not replace existing data
such as the SAE details in AE. Furthermore, it does not introduce a new requirement
to collect information that is not already indicated as Good Clinical Practice or
defined in regulatory guidelines. Instead, it provides a consistent place within SDTM
to hold information that previously did not have a clearly defined home.
This domain captures information pertaining to the death of a subject, including the
causes of death. There may be more than one causes. If so, these may be separated
into primary and secondary causes and/or other appropriate designations. DD may
also include other details about the death, such as where the death occurred and
whether it was witnessed.
死亡情况记录,比如死因不止一个时,可详细记录。在其他域如 SAE 中也可能存
在死亡记录。
6.3.12 免疫学评估 Immunogenicity Specimen Assessment IS
The IS domain is intended to be used only for data collected regarding the
immunogenic potential of materials under study.
免疫学检测结果,例如抗原抗体等
6.3.13 显微镜发现 Microscopic Findings (MI)
The Microscopic Findings dataset provides a record for each microscopic finding
observed. There may be multiple microscopic tests on a subject or specimen.
受控术语:MITEST/MITESTCD
This domain holds findings resulting from the microscopic examination of tissue
samples. These examinations are performed on a specimen, which has been
prepared with some type of stain.
Tests classified as "PATH" or "CYTO" in LOINC should be stored in the MI domain.
Biomarkers assessed by histologic or histopathological examination (by employing
cytochemical / immunocytochemical stains) will be stored in the MI domain.
⚫
MIRESCAT 可用于记录结果分类,如肿瘤的良恶性
⚫
MITSTDTL:如果使用生物标记,可用 MITSTDTL 说明
6.3.14 形态学发现 Morphology MO
Macroscopic results (e.g. size, shape, color, and abnormalities of body parts or
specimens) that are seen by the naked eye or observed via procedures such as
imaging modalities, endoscopy, or other technologies. Many morphology results are
obtained from a procedure, although information about the procedure may or may
not be collected.
受控术语:MOTEST/MOTESTCD/DIR/LAT/LOC/PORTOT/METHOD/EVAL
DI Domain
The example below shows a Device Identifiers (DI) domain record based on the MRI
device used for the brain measurement. A prerequisite for any Device domain is that
there will be at least one record in DI. The standard controlled terminology for
DIPARMCD, DIPARM, and DIVAL is represented in the table.
Device-in-Use (DU) data example related to MO results for the MRI device
This example shows data from one subject collected at two visits regarding
parameters from an MRI imaging protocol. DUGRPID is used to facilitate the creation
of a RELREC relationship to the morphological result(s) (see table below).
6.3.15 生殖系统发现 Reproductive System Findings RP
The Reproductive System Findings domain captures all Reproductive information
related to a subject.
This domain will contain information regarding, for example, the subject’s
reproductive ability, reproductive history such as number of previous pregnancies
and number of births, pregnant during the study, etc.”
受控术语:RPTEST/RPTESTCD
6.3.16 受试者状态 Subject Status (SS)
Subject Status is for data relating to general subject characteristics that are evaluated
periodically to determine if they have changed.
Subject Status must not contain data that belong in another domain. Periodic data
collection is not the sole criteria for storing data in SS. The criterion is whether the
test reflects the subject’s status at a point in time. It is not for recording clinical test
results, event terms, treatment names or other data which belong elsewhere
受控术语:SSTEST/SSTESTCD/SSSTRESC
6.3.17 癌症相关域 Oncology Domains: TU, TR and RS
Tumor Identification TU
The TU domain represents data that uniquely identifies tumors (i.e. malignant
tumors and other sites of disease, e.g. lymph nodes). The tumors are identified by an
investigator and/or independent assessor and classified according to the disease
assessment criteria. In RECIST terms this equates to the identification of Target,
Non-Target or New tumors. A record in the TU domain contains the following
information: a unique tumor ID value; anatomical location of the tumor; method
used to identify the tumor; role of the individual identifying the tumor; and timing
information.
TUTEST:Tumor Identification Test Name,受控术语,TUTEST(Tumor Identification、
Tumor Merged和Tumor Split)
TUTESTCD:受控术语,TUTESTCD(TUMERGE,TUMIDENT,TUSPLIT)
TUSTRESC:原始数据,数字型 受控术语,TUMEDENT
TULOC:肿瘤部位,受控术语 LOC
TULAT:左右,受控术语 LAT
TUDIR:位置,受控术语 DIR
TUPORTOT:部分或全部,受控术语 PORTOT
TUMETHOD:肿瘤诊断方法,受控术语 METHOD
TUEVAL:评价者,受控术语,EVAL
TUEVALID:评估者标志 受控术语,MEDEVAL
TUACPTFL(Accepted Record Flag):如果有多人评价,TUACPTFL 表明接受的是哪
个评价
TU 域假设
⚫
肿瘤位置等信息不必每次随访都记录。Post-baseline 可能记录:新发肿瘤;
肿瘤 split;split 肿瘤合并;
⚫
如果只关注肿瘤的发生,则 TUTEST=tumor identification;TUORRES=new,
TULNKID 用于连接 TR 域
⚫
如果还关注肿瘤的解剖信息,可加入 TULOC 等
TR 域 Tumor Results
The TR domain represents quantitative measurements and/or qualitative
assessments of the tumors identified in the TU domain. These measurements are
usually taken at baseline and then at each subsequent assessment to support
response evaluations. A record in the TR domain contains the following information:
a unique tumor ID value; test and result; method used; role of the individual
assessing the tumor; and timing information.
TRTEST:检测名称,受控术语,TRTEST
TRTESTCD:缩写,受控术语,TRTESTCD
TRMETHOD:受控术语,METHOD
TREVAL:受控术语,EVAL
TREVALID:受控术语,MEDEVAL
⚫
新增 LNKID 用于 TR 和 TU 域之间的连接,因为 GRPID,REFID and SPID 可能全
做其他用途
⚫
TRLNKGRP 用于连接 TR 和 RS 域
⚫
如果肿瘤太小,可用固定值 5mm(基于 RECIST 的研究)
RS 域 disease response
The RS domain represents the response evaluation(s) determined from the data in TR.
Data from other sources (in other SDTM domains) might also be used in an
assessment of response.
受控术语:RSTEST/RSTESTCD/EVAL/MEDEVAL
⚫
有示例文档 excel
6.4 Findings About Events or Interventions
Findings About Events or Interventions is a specialization of the Findings General
Observation Class. As such, it shares all qualities and conventions of Findings
observations but is specialized by the addition of the --OBJ variable.
7. 1 试验分组 Trial Arms TA
The trial arms table describes each planned arm in the trial. An arm is described as
an ordered sequence of elements
STUDYID, DOMAIN
ARM:计划分组描述,分组或治疗的名称 受控术语
ARMCD:ARM 的代码
TAETORD:元素顺序
ELEMENT:元素描述,受控术语
ETCD:元素代码,受控术语
TABRANCH:分叉条件
TATRANS:过渡规则
EPOCH:时期
⚫
分支与过渡的区别:分支就是试验中的随机分组;过渡是有条件的进展,如
如果疾病进展则过渡到随访期。
7.2 试验元素 Trial Elements TE
STUDYID, DOMAIN
ELEMENT:元素的描述 受控术语
ETCD:元素代码 受控术语
TESTRL:元素开始规则
TEENRL:元素结束规则
TEDUR:元素计划持续时间
⚫
元素之间没有间隔,一个元素结束,下一个元素马上开始
⚫
元素开始和结束比较难定义
7.3 试验访视 Trial Visits TV
The Trial Visits (TV) dataset describes the planned Visits in a trial. Visits are defined as
"clinical encounters" and are described using the timing variables VISIT, VISITNUM,
and VISITDY.
7.4 试验疾病评价 Trial Disease Assessments (TD)
The TD domain provides information on the protocol-specified disease assessment
schedule, and will be used for comparison with the actual occurrence of the efficacy
assessments in order to determine whether there was good compliance with the
schedule.
定期疾病评估域
8.1 相关记录域 relrec
8.2 补充修饰 supp
作用:SDTM 不允许增加新变量, 采集没有被列入常规域中的数据
⚫
⚫
何时需要 SUPP
⚫
SUPP 中每条记录凭借 STUDYID,ROMAIN,USUBJID,IDVAR/IDVARVAL 与源
纪录相连接
2. Define.xml
除了提交所有域的数据集以外,还需要提交一个文件 Define.xml。Define.xml
类似于域数据集的说明书,通过元数据(metadata)定义来提供每一数据集使用
的所有变量的信息。元数据的定义是描述数据的数据,目的是为了定义和使用变
量。
2.1 域级别的元数据
下图中展示的就是 Define.xml 的第一部分内容,域级别的元数据,给出提交
的每个域的信息。包括以下七个属性:数据集缩写 Dataset、全称(Description)、
分类(Class)、结构(structure)、目的(purpose)、必须变量(Keys)、文件位置
(Location)
2.2 变量级别的元数据
Define.xml 中需要提交的第二部分内容是每个域中各个变量的元数据,如下
图 DM 域。其中包括 8 个属性:变量名(Variable)、变量标签(Label)、必须变
量编号(Key)、变量类型(Type)、变量长度(Length)、变量的受控术语(Controlled
Terms Format)、变量值来源(Origin)、注释(Derivation/comment)。
⚫
这里的受控术语(Controlled Terminology)是指变量被控制,只能填入
相应的术语值,例如某变量的受控术语是["N" = "No", "U" = "Unknown",
"Y" = "Yes"],则这个变量的取值只能是 N,Y or U。
⚫
变量值来源(origin)包括:
CRF:直接从 CRF 采集,包括印在 CRF 上的信息
eDT:数据通过电子数据传输而来
衍生(derived):通过算法或规则计算而来,依赖于其他数据值,实验室测
试结果不算衍生的
指定(Assigned):有评估者决定的值,如用于编码的变量名
方案(Protocol):试验设计准备的材料
⚫
如果一个变量的值一部分记录是从 CRF 采集的,另一部分记录是衍生的,
则在 value-level 元数据显示来源具体是 derived 还是 CRF;而在
variable-level
⚫
元数据中显示 Derived,CRF。
变量标签最多 40 字符
2.3 值级别的元数据
2.4 受控术语范围
Define.xml 第四部分的内容是受控术语的取值范围,如果某个变量的值不是
自由选取的,则需要在 Define.xml 中给出该变量的取值范围。CDSIC 给出了常用
受控术语的取值。
http://www.cancer.gov/cancertopics/cancerlibrary/terminologyresources/cdisc
如果一些受控数据时来自外部的词典,比如药品的标准名称可来自 WHO
Drug Dictionary,则在 define.xml 中要给出词典名称及版本。
2.5 其他
一些变量是由其他变量衍生计算出来的,在 define.xml 中要给出这些变量间
的关系和计算公式
Define.xml 中还需要汇总各变量的注释
3. SDTM 中变量可分为五种
Identifier:标识变量
Topic:主题变量
Timing:时间变量
Qualifier:修饰语变量,包括分组、结果、同义词、记录和变量修饰语
Download