您的位置:beat365亚洲官方网站 > 生命科学 > 重磅 | 复旦大学“华表”项目启动,构建中国首

重磅 | 复旦大学“华表”项目启动,构建中国首

2019-11-03 16:07
缺乏数据使用指导原则,基因组数据共享遇阻

图片 1

■本报记者 秦志伟

11月11日,人类遗传资源数据保藏与共享研讨会暨“华表”全外显子公共数据库发布会在京举行。中国科学院院士、复旦大学副校长金力,国家卫生计生委医药卫生科技发展研究中心主任李青等30余位遗传学、人类学、临床医学、基因组学权威专家、产业领袖及行业资深人士参加本次研讨会。此次会议由复旦大学现代人类学教育部重点实验室主办,艾吉泰康生物科技承办。

基因组数据共享将生物医学研究推向快车道,但向公共领域发布的现有数据指南一方面承认免费和无条件使用数据的重要性,另一方面还未能解决这种重要性与数据生产者首次发布数据的“权利”之间的关系。

大会上,与会专家共同启动了“华表”全外显子公共数据库发布仪式,该项目由复旦大学现代人类学教育部重点实验室联合艾吉泰康于2017年9月发起,是中国首个以共享为主要目的的全外显子公共数据库,将为我国参比基因组数据集的建设以及精准医学的发展起到巨大的推动作用,也将对科研临床研究产生深远影响。

在美国能源部联合基因组研究所负责人Nikos Kyrpides看来,这种自相矛盾导致了数据生产者和数据使用者对公共数据的使用有着不同的解释和持续的争论。

图片 2

“根源在于缺乏数据使用的明确指导原则。”在接受《中国科学报》采访时,Kyrpides再次强调,公共数据应该被视为开放资源,不受限制地被用于分析、解释和发布。相关论文近日在线发表于《科学》。

近年来,随着生命科学与生物技术研究开发的进展,围绕着人类遗传资源的保护、管理与利用的国际竞争日趋激烈。人类遗传资源的开发利用以及管理水平将成为决定未来各国生命科技与产业竞争成败的重要因素。

时不时遇到“软障碍”

国际上相继展开多次人类基因组遗传密码破解计划。2001年,人类基因组计划构建第一个人类参考基因组。2008年,千人基因组计划启动,对全球不同人种的2500例样本进行全基因组测序,绘制完成迄今最为详尽的人类基因组变异图谱,包括8470万SNP、360万indel和6万结构变异位点。由于不同人种间基因组变异位点及频率存在显着差异,各国纷纷启动面向本国/本地区的基因组测序计划,以发现人群特有的基因组变异,建立更加精准的参考基因组,服务于健康和医学领域。

公共基因组数据使用自由是国际生命科学研究领域的传统与共识,自人类基因组计划实施以来,大量的开放共享基因组数据信息极大地促进了生物医学研究的进步。

但是国际上公开的人类基因组变异数据大多来源于西方人群,利用其作为参比数据,常造成我国基因组研究和临床应用结果的不准确,因此亟待通过高质量测序数据的获取,建立覆盖全国、有地域代表性、标准统一的中国人群基因组数据库,并探讨数据库共享机制,以满足我国生物医学研究的需求。

1990年启动并有我国参与的人类基因组计划被看成科学史上的伟大工程,3年前,该计划负责人Eric Green、James Watson和Francis Collins在《自然》上撰文总结了人类基因组计划的6点经验,其中之一是数据共享最大化。

为此,在国家科技部和卫生计生委有关部门的指导下,复旦大学与艾吉泰康携手联合,利用双方资源优势,启动“华表”全外显子组数据库项目。据悉,项目第一阶段主要目的是通过对覆盖全国、有代表性的汉族人群样本进行高质量测序,系统解析外显子区域等位基因频率,精细刻画中国汉族人群遗传结构,形成我国自主建设的中国人群基因组数据库。同时,在遵循国家人类遗传资源管理条例的框架下尝试推动包括基因组数据在内的各类人类遗传资源数据的保藏与共享,并为下一步的精准医学研究提供参考数据集。

正是人类基因组计划改变了生物医学研究的数据共享原则,促成了1996年百慕大原则,即同意将超过一定规模的基因组测序数据在产生后的24小时内提交到公共数据库。

会上“华表”项目总设计师金力院士表示,两年前我国开始推动精准医学重点研发项目。经过若干战略讨论,一致认为我国精准医学项目成功与否的重要关键就是“共享”二字。“共享是推动精准医学发展的抓手,如果数据不能共享,精准医学、人工智能等理想将永远停留于梦想,止步不前。”

一直以来,促进数据共享仍在继续并有新的变化。2003年劳德代尔堡协定重申和扩大了百慕大原则,认为大规模基因组序列数据的预发布对科学界有巨大的益处,同时指出数据共享限定在团体资源项目。

图片 3

自该协定签署以来,实现更广泛、更快速、更有效的数据共享成为学界反复讨论的主题。

据了解,“华表”计划的架构设计是由复旦大学金力院士团队提供顶层设计,艾吉泰康用自主开发的AIwholeExome全外显子捕获芯片进行捕获测序,第一批研究样本由复旦大学提供,后续有望收集更多研究样本,也期望为研究者分享更多高质量数据。

在数据共享大背景下,学术论文在发表时,一般都会公开并共享相关的基因组数据。“但是政府资助的各类科研项目产出的基因组数据,数量更为广泛,在论文发表前共享程度极低。”中国科学院—马普学会计算生物学伙伴研究所研究员张国庆告诉《中国科学报》。

金力院士同时表示,“华表”项目有两个关键点。第一是群体代表性。我国幅员辽阔,文化历史悠久,不同人群在遗传上具有很大差别。共享数据能否真正代表全国各地不同人群的遗传差异性和多样性,是至关重要的核心问题。第二,数据质量必须高。高质量数据才有研究与应用价值,从第一批数据的初步分析结果来看,他对数据质量非常有信心。

张国庆使用国际基因组数据时曾被要求填写申请,“但由于审核机制不透明,导致时不时地遇到‘软障碍’”。

科研数据包括基因组数据的共享既是伟大工程,也面临巨大挑战。李青主任认为,当前基因测序技术与临床研究的不对称发展就是突出的问题之一。过去20年间,测序成本下降了100万倍,但临床研究思路和手段依然没有实质性变化,仍沿袭过去的套路,这就造成测序技术与临床技术“一快一慢”的不平衡发展,测序数据如何与临床症状对接,消弭不对称性,将接下来要克服的重要课题。

“数据共享政策并不是一成不变的,许多资助机构已经对政策进行了微调。”Kyrpides介绍,比如2014年美国国立卫生研究院制定的基因组数据共享政策,正在创造一个更完善的数据共享生态系统,“这是以前协定所没有的”。

他表示认同和支持“华表”项目的开展,希望可以动员全社会自下而上,发挥众人聪明才智,利用市场机制和颠覆性技术,应用创新理念和商业模式,打通这条道路,共建数据共享的恢宏大厦,最终实现信息资源和数据整合这一政府多年的夙愿,进一步深化推进健康中国建设,为国家医疗健康事业作出新贡献。

“这不是自相矛盾吗”

国家人口与健康科学数据共享平台管理主任尹岭教授,分享了国家公共数据平台运营情况。他表示,近年来我国在精准医疗、慢病管理等领域建立诸多医学研究基地。在人口健康平台上,每一个疾病都由最顶级的研究单位和专家承担,收集肿瘤标本、肿瘤实体标本化验、临床数据、基因数据构成庞大数据库。他强调,此次华表数据发布是建立中国人的遗传基因数据库,包括保藏管理系统和知识产权发布系统等,将为国家人口与健康科学数据共享平台贡献全新的宝贵数据。

本文由beat365亚洲官方网站发布于生命科学,转载请注明出处:重磅 | 复旦大学“华表”项目启动,构建中国首

关键词: