中国科学院院士 陆林
随着科技的发展、医学诊疗手段的提高、精准医学的实施,很多躯体疾病已经被攻克,但精神心理疾病仍面临着病理生理机制不明、治疗手段单一且疗效个体差异大的困境,成为全球性的公共卫生问题和社会问题。
据估计,我国精神心理疾病患者总数超过2亿,造成极大的疾病负担。对于精神疾病这类复杂疾病,诸多遗传和环境因素共同作用,只有利用多维度大数据才能取得突破性进展。
从上个世纪七十年代世界首例全基因组测序开始,我们逐渐步入了生物医学大数据时代,至今,基因测序技术已经发展到第三代,生物医学大数据也从基因组学,扩展到包括蛋白组学、转录组学、代谢组学、连接组学等在内的更广阔的领域;再加上医院信息管理系统的全面上线、可穿戴设备的普及,使得临床医疗数据以及生理数据的实时采集成为可能。
随着大数据的累积,随之而来的问题是如何将这些数据资源转化为有价值的信息,并指导临床实践的问题。我国人口基数庞大,是世界上拥有临床数据资源最丰富的国家,但面临着数据采集标准和质量参差不齐、缺乏有效随访、不同来源的数据难以整合等问题。
比如北京大学精神卫生研究所承担的中央补助地方重性精神疾病管理治疗项目(简称686项目),已录入超过600万重性精神疾病患者的临床资料,可以为建立精神疾病复发和不良结局预警模型提供丰富的数据来源,但目前这部分数据并未得到充分的利用,一方面缺乏有效随访获得的结局变量,另一方面也无法与现有的结局指标数据库相关联,如死亡注册系统。对于如何实现不同数据资源的关联和整合,我们可以借鉴国外如瑞典和丹麦等的经验。
另外,医学数据采集和分析的最终目的是要服务于医学实践,将无意义的数据转化为有价值的信息服务于临床诊疗,一方面可以通过跨学科的合作,医学科研人才与计算机领域人才合作;另一方面医学科研人员需要交叉学科的理念,增加对人工智能等新领域的技术方法的了解。