肿瘤精准医疗临床大数据的建设曙光已现,蓄势待发

时间:2015-07-29 作者:

\
 
7.22-23日,由中国医院协会医院信息统计专业委员会主办的关于"肿瘤精准医疗临床大数据采集与应用专家研讨会"在美丽的江苏盐城顺利召开。有30多名国内专家出席了本次研讨会,总参会人数70多人。主要来自北京、上海、广州、南京等近20家知名医院的专家领导,及少数医疗投资人,肿瘤药企代表。中科院生物物理研究所陈润生院士、卫计委信息化办副主任、中国医院协会医院信息统计专业委员会主任高燕婕女士、江苏省抗癌协会秘书长吴建中先生应邀出席了会议,国家级盐城经济开发区国际软件园、华生基因、北京生物技术研究院联合主办了本次会议。
 
\
 
高燕婕主任致大会开幕辞,明确表达了主办本次会议的初衷,探讨如何规范建立结构化、标准化的医疗临床数据统计与分析模型,建立并共享肿瘤大数据库,逐步实现精准诊断精准治疗的目标。
 
\
 
我们赶上了生物信息学发展的历史机遇
 
陈润生院士他认为眼前的精准医疗火热是个好事,说明大家都很重视,都在努力推动中国精准医疗事业的发展。他说作为生物信息学的专家,这么多年来才真正赶上历史上最好的开端,将IT与生物及临床交叉融合的时代。这一领域的发展前景是光明的,代表着医学领域的一场新革命要到来了。
 
他认为医疗临床大数据的建设是推动精准医疗发展必不可少也是至关重要、难度较大的因素,应由政府牵头,联动社会力量一起来做这件事。目前无论从国家层面还是社会机构,都已有很多人在关注这件事,并开始了一定的尝试。今年初,卫计委联合中医药管理局公布了肿瘤登记管理办法,要求建立完善全国肿瘤登记制度,动态掌握我国癌症流行状况和发展趋势,并逐层建设省、市、县级肿瘤登记中心。国家癌症中心定期汇总和分析登记资料、编制各种报表,形成年度肿瘤登记报告,按时上报国家卫计委审核后发布。同时,一些院校、科研机构也在试点这样的健康人群队列数据和生物样本库,尝试完成未来几十年的健康状况跟踪。
 
社会上一些敏感的企业也意识到了这一项目的重大意义,在做一些积极而有意义的工作,如万人癌症计划,万人全基因组测序计划等,大家都在瞄准精准医疗的这块蛋糕,群情振奋,蓄势待发,这是可喜的一面,精准医疗革命性的时代真正来临了。
 
组学和大数据是精准医学发展的基础,非编码的破解是精准医学的一大挑战
 
在报告中陈院士还强调了基因组学的重要性,尤其是非编码区的认知,他认为组学和大数据是当前决定精准医学发展的一个基础,两者结合起来正好是生物信息学的研究。组学包含了基因组、转录组、蛋白质组、代谢组等,而基因组绝大部分的转录产物是非编码RNA,物种之间的差别也是非编码RNA。有研究表明,从小鼠中获得了约180,000个RNA转录本,其中编码蛋白质的转录本仅有约20,000个,其余约160,000个转录本全部归属于非编码RNA。而NcRNA与疾病的关系是非常密切的。
 
"现在我们了解到的基因大约只占人类遗传密码的3%,另外97%的遗传密码还有待研究和探索,所以从基因组学这个角度来讲,我们还有太多的路要走,还有太多的知识有待发现。只有把基因组中所有遗传密码的功能和作用都搞清楚了,人类才会对自身的遗传密码有一个完整的认识。"因此非编码区的破解是精准医疗发展的重点,构建非编码NcRNA数据库的意义非常重大。目前陈院士的团队已收集了在各种杂志上发表的、网站上公布的所有被实验证实的NcRNA基因,并开发了相应的软件及检索工具,建成了NcRNA数据库,相关论文已送Nucleic Acids Research,上网两个多月点击已超过12万次。韩国已要求合作成为他们的镜象。
 
\
 
移动互联网技术服务于精准医疗
 
作为国内较早从事生物信息研究的高科技企业北京华生恒业科技有限公司董事长饶江先生,从移动互联网技术服务于精准医疗的观点阐述了医疗临床大数据的采集方式和分析方式,他认为用互联网技术采集有实时采集、实时显示、数据量大的优点,同时结构化的数据也便于统计分析,宏观上能准确反映肿瘤病人的分布情况、疾病分布比例、病人入院年龄分布、治疗方案统计等数据,微观上,可以统计出分子诊断治疗及检测医院分布、治疗方案及疗效评价、药物副反应情况等,及时反映肿瘤病人的治疗现状,有助于深度挖掘肿瘤治疗的规律,为精准医疗提供参考依据,助推肿瘤新药研发等。这些统计数据可提供给政府统计、保险、科研、投资机构,也可提供给肿瘤药企等。当然这种网络技术实时采集也有一定的局限性,结构化的数据优化设计、图像文件的自动识别、医务人员的时间精力、数据质量的可靠性、连贯性、病人的随访跟踪、数据挖掘细分的价值等。但饶江先生表示,这些问题都将会随着市场的实践和科技的发展而不断解决。就在会议当天,华生基因获准了挂牌新三板的股票代码,江苏华生恒业科技股份有限公司(833190)。
 
建立常见肿瘤的数据库
 
根据不同地区的高发癌种,可尝试建立地区型肿瘤数据库,例如广东省成立了食管癌研究所,建立全省食管癌数据库,通过主动筛查发现早期患者,推进食管癌早诊早治,掌握广东食管癌流行病学状况。同时医科院肿瘤医院也建设了这样的食管癌肿瘤数据库,目前该数据库已入组3万余例。其数据库的研究价值对全国来说都具有重大意义。
 
\
 
医学信息的高速公路需要政府的顶层设计
 
讨论中还有其他专家表示,目前各医院的HIS信息系统都不一,没有统一的接口和数据格式标准,建议由政府部门牵头制定HIS产品标准,新布署的HIS系统要求统一,原有的系统可通过开发补丁软件或其它技术手段来兼容。医疗大数据的建立需要国家的顶层设计,医学信息高速公路的发展需国家牵头。虽然存在蛋糕和利益分配的问题,但政府部门如果将这类政策制定下来,再进行市场化配置还是可以避免集权、利益的垄断。
 
数据处理的基础是建立在准确的高质量的数据内容基础上。这么多年来,中国的真正问题是没有能够提供一个公开、透明,全国行政、科研工作者都能够公开获得的国人健康数据。如果连数据都没有,或者只有质量很差、真实性不够的数据,再高的分析技术都没有用。在大数据的建设上,我们不能短平快做事,要制定符合自己国情的路径,不能盲目跟着美国的概念走,如果要跟,也要将美国人前期的工作补上,不可能一步到位。
 
建成后的数据库可共享使用,参考美国NCI,而不是仅仅成为政府垄断性和特权性数据。谷歌投资的Flatiron Health,很多数据也是来自国家系统。封锁起来的数据只会睡觉,不会对人民有意义。
 
\
 
当务之急要建立数据采集的内容和质量评价标准体系
 
大数据将催生科学研究方法的巨大转变,从假设驱动的方法转向数据驱动的方法。大数据已经成为时代的特点,云存储云计算已经在快速向各行各业渗透,在健康服务领域也不例外。虽然当前大数据有过热之嫌,但仍不能遮蔽其改善人类生活的强大魅力。对健康大数据而言,当前最迫切之问题是建立数据采集的内容和质量评价标准体系、构建数据分析和可视化建模的优质方法,只有切实解析出影响干预决策的关键性数据,才能改善医疗服务质量并提高服务效率,最终实现人类对医疗健康的美好希望。目前一些大的软件公司华为、东华、浪潮等都介入到了数据的处理上,联合打造数字化医院的解决方案。
 
最后,卫计委信息化办副主任高燕婕女士作了总结和指导。她认为,这次研讨会开得非常成功,大家讨论得也非常热烈,对当前医疗临床数据的现状、问题作了很好的剖析,为将来大数据的建设发展作了一个很好的探索。精准医疗离不开大数据的统计分析,我们也将依靠国家的力量来推动并加快这项工作的进展。以此次会议为切入点,今后将多牵头组织这样的专家研讨会,发展组织联盟,为推动中国精准医疗大数据的建设奠定基础并做些有益的试点和实践。来源:沈素华