生物医学大数据分析 与挖掘 蒋太交 中国科学院生物物理研究所 研究员 湖南大学国家超级计算中心 教授(兼) 北京健数通 首席科学顾问 湘雅大数据讲座 2014.5.10于长沙 报告内容 一、生物医学大数据分析挖掘的几个方向 二、基于流感大数据发展流感预测预警新方法 大数据时代 交通大数据 智能交通 气象大数据 天气预报 股票 金融大数据 商业大数据 生物医学大数据 智慧医疗和 个性化医疗 ? 医院信息化产生海量临床数据 临床大数据 美国卫生信息化发展计划 2011年,美国卫生信息技术协调官办公室发布全国卫生信息化发展计划,计 划时限2011-2015 我国卫生信息化发展计划 35212工程 美国VS中国 美国 系统逐步成型、理念推广、政策制定、科 学研究 中国 系统建设和部署 临床大数据的特点与现状 临床大数据的采集与标准化 临床大数据- 沉睡的金矿 临床大数据 临床大数据分析与挖掘 临床大数据分析与挖掘-病因识别 相关性 分析 大数据驱动 的病因分析 https://www.bgc-jena.mpg.de/bgi/index.php/People/MaartenBraakhekke 临床大数据分析与挖掘-样本筛选 根据临床大数据中病人多方面的信息,选择满足生物医学研究/临床实验需 要的病人,获取相应样本. 相对于传统选择样本的方式,其优势在于: 选择面广,便于控制干扰因素,结果更明显; 节约人工和经济成本; 加快研究/实验进程 Source: http://blog.digitalpathologyinsights.com/2014/04/23/moreefficient-clinical-trials-with-tissue-phenomics/ 临床大数据分析与挖掘-临床决策支 持 Treatment C Treatment A Treatment B Treatment D Treatment E 临床大数据分析与挖掘-健康评估 统计学建模 综合健康评估 临床大数据分析与挖掘-疾病预测预 警 疾病分子标志物识别: ER/PR, bcl-2,p53, AFP,CEA等等 健康指标异 常检测 .. 疾病风 险预测 F(x) Risk = w1*SNP1+ w2*SNP2+…+ wi*SNPi https://customercare.23andme.com/entries/21548199-Understanding-Health-Risk-Reports 临床大数据分析与挖掘-个性化诊疗 The U.S. Food and Drug Administration defined personalized medicine as “the best medical outcomes by choosing treatments that work well with a person’s genomic profile or with certain characteristics in the person’s blood proteins or cell surface proteins” http://home.ccr.cancer.gov/connections/2010/Vol4_No1/features_pg2.asp http://blog.sciencenet.cn/blog-41174-719048.html The first human trial of a pioneering personalised cancer treatment developed at Oxford University will begin this week, with the potential to tackle a wide range of latestage cancers. Inefficacy of the one-dose-fits-all approach. The average response rate of a cancer drug is the lowest at 25%. Personalized medicine drugs for breast cancer as of July 2012 http://www.ox.ac.uk/media/news_stories/2014/140313_2.html J Breast Cancer 2012 September; 15(3): 265-272 临床大数据分析与挖掘-个性化诊疗 P4 Medicine: personalized: it takes into account a person’s genetic or protein profile. preventive: it anticipates health problems and focuses on wellness, not disease. predictive: it directs appropriate treatment and avoids drug reactions. participatory: it empowers patients to take more responsibility for their health and care. 报告内容 一、生物医学大数据分析挖掘的几个方向 二、基于流感大数据发展流感预测预警新方法 临床大数据分析与挖掘-流感危害性预 测 y = 31.31 x - 8.85 R2=0.83 通过分析流感监测产生的大数据,社会经济大数据以及大 量基因序列,以及大量的相关性分析,发现了快速预测流 感病毒危害性的新方法 Wu et al., 2010, Plos Computational Biology; 早期预测流感危害程度的计算模型在流感防控策略上具 有十分重要的应用价值,该工作在国内外引起重要关注 《流感重要的科学问题》 接种疫苗是控制流感传染最有效的手段 Vaccination Every season, WHO will recommend trivalent vaccine composition: A/H1N1, A/H3N2, and B Grown in eggs Inactivated virus or live attenuated virus Injection (Flu shot) 24 世界卫生组织(WHO)在全球建立了一个流感监控网络。 目前流感疫苗推荐不是非常有效 世界卫生组织WHO推荐疫苗的准确度不高:对中国地区 :2/7 其他北半球地区:4/7 Based on 7 seasons during 2002-2009. Du et al. Nature Communications 2012. 26 临床大数据分析与挖掘-流感疫苗推荐 大规模病毒采样 与基因测序 流感病毒关联 网络 疫苗推荐 该工作发表在《Nature Communications》上, 被选为亮点文章,并且同期《Nature》杂志也对 该工作进行了报道 Du, et al., 2012, Nature Communications. 新方法优于目前WHO使用的方法 我们预测的准确度: 对中国地区 6/7;其他北半球地区6/7。 X X Based on 7 seasons during 2002-2009. X X X X X X X X 世界卫生组织WHO:对中国地区 2/7;其他北半球地区4/7 1,目前该方法已经申请了专利。 2,在使用我们的方法向WHO推荐疫苗参考株。 3,Nature Communcations, 2012. X X X X X X X X X X 新华社发布的新闻:我国科学家发明流感 疫苗株快速选择新技术 我国2013年华东地区H7N9溯源 进化分析 大规模病毒采样 与基因测序 Wu et al. 2013. Cell Host & Microbe 通过多源数据整合,我们发现H7N9是两次重 配的结果 Cell Host & Microbe. Oct 2013. 该工作对流感防控具有重要的指导意义 临床大数据的价值 更深入的理解人类疾病 个性化诊疗 智能临床决策 医学研究方式的转变:假设驱动转变为数据驱动 临床大数据 卫生信息化发展计划 国家卫生信息化“十二五”规划“35212工程” 重点建设国家级、省级和地市级三级卫生信息平台 加强信息化在公共卫生、医疗服务、新农合、基本药物制度、综 合管理五项业务中的深入应用 建设电子健康档案和电子病历二个基础数据库 建设一个医疗卫生信息专用网络 逐步建设信息安全体系和信息标准体系 Google Flu Trends http://www.google.org/flutrends/ 糖尿病病例识别算法 对照病例识别算法 Joint study by Northwestern University , Mayo Clinic ,Marshfield Clinic Research Foundation, Vanderbilt University, Group Health Cooperative 临床大数据分析与挖掘-临床决策支 持 临床决策支持系统(CDSS)是用来帮助医生和其他医护人员做临床决策支持的交互式 计算机软件。现在常用的一些 CDSS包括Archimedes IndiGO, Auminence, DiagnosisOne, Dxplain等等。CDSS的发展趋势是与HER融合,成为后者的重要组 成部分。临床大数据将极大地改善此类系统的准确率。 提高患者安全 降低药物差错和不良反应 改善用药与检验的顺序 提高医护质量 减少临床医生处理日常事务的时间 增加临床路径和临床指南的使用 提高医护信息传输的有效性 提高医嘱过程,降低成本 改变了现有处方的模式 http://www.eeworld.com.cn/medical_electronics/2012/0101/article_2627.html