国家基因组科学数据中心生物多样性分中心

国家基因组科学数据中心生物多样性分中心于2023年12月成立,依托单位为中国科学院昆明动物研究所。

建设目标

立足我国西南与东南亚地区丰富的遗传多样性资源,充分集聚生物多样性演化、保护与可持续利用优势资源,通过大数据整合与分析,对生物多样性数据进行系统管理和深度挖掘,开展生物多样性共享、应用和以大数据为核心的基础性、前瞻性研究,为维护国家生态文明和生态安全屏障建设、人民健康提供高质量的支撑服务。

研究方向

依托遗传进化与动物模型全国重点实验室、模式动物表型与遗传研究国家重大科技基础设施(灵长类)、国家非人灵长类实验动物资源库、中国西南野生生物种质资源库(动物种质资源分库)、西南生物多样性实验室、云南省西南及跨境生物多样性数据信息重点实验室、昆明动物博物馆、生物多样性大数据中心、生物多样性基因组中心等多个生物多样性平台,系统梳理生物多样性科学数据资源,开展“第二次青藏高原综合科学考察”、“动物复杂性状的进化解析与调控”等重大项目数据汇交和相关论文数据汇交,探索建立面向解决世界难题的时空格局型、资源功能型和关系纽带型更为复杂的生物多样性综合数据汇聚,研究全面支撑生物多样性数据资源存储、共享、应用和挖掘的大数据技术体系。

特色资源

开发“西南及跨境生物多样性大数据平台”、“生物多样性全景图”、“灵长类ENCODE数据库”、“新冠病毒全球演化跟踪、新冠疫情全球动态监控预测平台”等一系列权威数据库/信息平台,相关数据库工作入选两项院级十大进展,引领科研范式变革示范。

基础设施

已建成“云-数-智-存”一体化数智大数据中心集群,计算能力超过300万亿次,存储6.5PB,拥有三级网络安全等级保护全方位防护能力;汇聚数十亿条科学数据,实现上百TB的生物资源对外共享。

中心负责人

吕雪梅,博士,研究员,博士生导师,中国科学院引进海外高层次人才、“西部之光”引进人才、云南省引进高层次人才。中国科学院昆明动物研究所进化生态与多维组学动态学科组负责人,主持中国科学院生物多样性信息化区域中心、云南省西南及跨境生物多样性数据信息重点实验室、昆明动物所进化发育研究中心工作。目前已在National Science Review、Science Advances、Nature Communications、Molecular Biology and Evolution、PNAS、Genome Research、Science Bulletin等期刊上累计发表SCI论文63篇,获得专利11项、软件著作权2项、参与制定国家科学数据标准4项。主持及承担科技部国家重点研发计划课题及应急专项、中科院战略先导专项、基金委重大研究计划重点和集成项目、第二次青藏高原综合科学考察研究课题等。

国家基因组科学数据中心肿瘤基因诊断数据分中心

国家基因组科学数据中心肿瘤基因诊断数据分中心于2024年4月成立,依托单位为浙江大学医学院附属第一医院。

建设目标

推动肿瘤基因诊断数据汇交、共享;建设肿瘤基因诊断等方面的数据库;开发肿瘤基因诊断相关算法、软件、系统;开展肿瘤基因诊断相关科普、成果推广。在此基础上,围绕肿瘤基因测序大数据、医学信息学、临床诊疗服务技术和生物信息学等领域,开展创新研究和成果转化相关工作,挖掘多学科交叉在肿瘤基因诊断领域的无限可能性,培养学科交叉型肿瘤基因诊断高端人才。

特色资源

目前已产生肿瘤基因诊断数据约160TB,肿瘤基因研究相关测序数据约1PB。

基础设施

1.科研测序平台:现有Illumina NovaSeq 6000、Illumina NextSeq 2000、Illumina NextSeq 550Dx等多台测序仪,并将按实际需求继续扩充,可满足大批量临床样本测序数据产生;2.高性能超算平台:配备约6000核计算能力和约10PB存储的高性能计算硬件,可支持多方向的医学大数据与人工智能科研工作,面向全院提供数据存储和计算服务、数据科研服务、数据资源服务;生物医学大数据高性能计算中心是由CPU+GPU组成的异构高性能计算集群系统,持续为院内高水平科研提供高质量计算算力及高性能的数据存储,理论峰值性能为259660.8 GFLOPS,拥有60台双路普通计算节点、9台大内存计算节点、2台GPU计算节点,并配以Mellanox 100 Gbps Infiniband EDR 高速网络互连,以及10PB高性能BeeGFS并行文件存储系统,体现了强大的计算存储能力和先进的设计理念;3.数据分析平台:具备快速分析全基因组、全转录组、单细胞、质谱流式和微生物等分析条件。

中心负责人

黄金艳,博士,研究员,浙江大学医学院附属第一医院生物医学大数据中心负责人。担任中国医药生物技术协会基因检测技术分会委员、中国病理生理学会实验血液学青年委员会委员和中-法应用科学会(FFCSA)俱乐部主席。主要从事组学数据的分析与挖掘、恶性肿瘤分子分型和发病机制研究。研发了一系列医疗卫生软件系统,在Cancer Cell、Genome Biology、PNAS和Bioinformatics等学术刊物以第一或通讯作者发表SCI论文50余篇,总影响因子超过500,共同主编《R语言在生物医学领域的应用》一书。取得软件著作权2项,申请专利6项。

国家基因组科学数据中心中医药分中心

国家基因组科学数据中心中医药分中心于2024年6月成立,依托单位为中国中医科学院医学实验中心。

建设目标

面向我国人口健康和社会可持续发展的重大战略需求,建立中医药生命组学与健康大数据开放共享与整合挖掘研究体系,研发中医药大数据前沿交叉与转化应用的新方法和新技术,为科研人员提供更加便捷、高效的数据获取途径,从而推动中医药的创新与发展。

研究方向

1. 中医药基因组科学数据资源标准化体系 2. 中医药生命组学大数据底座建设 3. 中医药健康大数据生物语言基座模型 4. 中医药前沿交叉智能计算平台。

特色资源

1. 中医四诊客观化信息数据(健康人、孕妇、慢病患者)2. 中医特色临床疾病的证候病人生物样本蛋白质组、代谢组数据资源 3. 中医药基础研究疾病动物模型器官蛋白质组、代谢组、转录组及质谱成像数据资源 4. 药用动植物的叶绿体(线粒体)基因组,核基因组、基因注释、比较基因组、转录组、蛋白结构组、代谢组、名贵中药种质的重测序等特色数据资源。</p>

中心负责人

袁媛,中国中医科学院首席研究员,国家杰青。中国中医科学院医学实验中心副主任,兼任中华中医药学会中药鉴定分会主任委员,中国中西医结合学会分子生药学专业委员会主任委员,中国中药协会种子种苗专委会副主任委员。主要从事中药鉴定与分子生药学研究。先后获中国青年女科学家奖团队奖、北京市科技新星、科技部中青年科技创新领军人才、国家中医药管理局青年岐黄学者、中国科协求是杰出青年成果转化奖等。获国家科技进步二等奖、中国中西医结合学会科技进步一等奖、中华中医药学会科技进步二等奖等8项,在Nature communications、Science Bulletin等期刊以第一或通讯作者发表论文120余篇,授权专利43项,发布国家标准、团体标准11项。

国家基因组科学数据中心医学基因组东北分中心

国家基因组科学数据中心医学基因组东北分中心于2024年11月成立,12月20日举办揭牌仪式,依托单位为吉林大学第一医院。

建设目标

在充分发挥各方在研发能力、技术储备、资源储备、人才培养等方面互补性优势的基础上,开展国家基因组科学数据中心医学基因组东北分中心建设。推动东北地区的基因组数据开放共享;建设东北高发的肝胆胰肿瘤及结直肠肿瘤等病种的基因组数据库;建设东北梅河地区自然人群队列数据库;开发东北地区自然队列和特殊疾病的基因组科学相关算法、软件、系统;开展东北地区基因组科学相关科普、成果推广。

特色资源

1. 真实世界数据应用平台吉林大学第一医院真实世界数据应用平台是可扩展性的医院真实世界数据应用平台,系统化地集成和整合的门诊住院的诊断、医嘱、检验、检查、影像、病理、病历文书等各种临床表型数据以及生物样本库和基因检测数据,实现跨模态、全周期的数据融合,打破原有信息化系统的界限,让科研项目可以低成本使用全维度数据。目前为止,已经接入自2009年至今的包括HIS、EMR、LIS、PACS在内的业务系统数据库32个,数据表‌192张。截止2024年9月26日数据量33.4亿条。接入全部生物样本自建库以来的数据66万条,样本数据涵盖院内104个科室,11万+患者,实现样本数据与临床表型数据的映射与整合。重构了基因检测数据的处理、整合、检索和使用新模式,接入包括我院、先声、吉因加、臻和、泛生子、燃石等20多家基因检测机构的检测报告,并对报告进行自然语言解析,设计284个用于临床科研字段,实现与临床表型数据的组合智能检索,方便科研患者的招募和研究对象的纳排;在对基因检测报告结构化的基础上,对原始基因检测的‌FASTQ‌文件和实体肿瘤VCF文件(容量总计1170多T)进行储存设计,实现与患者的映射,为促进基因数据的使用,制定了基因数据申请审批流程,构建生信分析平台,生信平台现配备高速计算集群,拥有强大CPU算力和超大存储空间,提供卓越的数据处理能力,保证基因数据合规而方便得使用。临床科研平台基于患者诊疗时间轴进行了患者表型数据、生物样本数据和基因检测数据的融合,为科研灵感发现、科研验证、圈定研究对象、研究指标确定、数据纳排、统计分析和成果转化提供支持,为医学领域的基础研究、临床研究和转化研究奠定基石。2. 生物样本库吉林大学第一医院生物样本库始建于2008年,现有专职员工10人,占地面积近千平,建有标准化、规范化的质量管理体系,入出库流程清晰,便捷,支持医院在科研项目申请,SCI论文发表,临床医学研究中心申请等多个方面取得重大成果。1) 2019年7月首次顺利通过科技部人类遗传资源保藏的资质认证,是吉林省首家获得科技部认证的法人单位; 于2023年再次获得科技部人类遗传资源保藏的资质认证;并于2022和2024年分别获得科技部人类遗传资源罕见病采集审批和梅河队列项目采集审批。 2)具有完善的伦理审批文件:分别于2019年、2021年、2022年通过伦理委员会“吉林大学第一医院生物样本库保藏项目”、“吉林大学第一医院生物样本捐赠者知情同意书”、“吉林大学第一医院生物样本库保藏项目”的伦理审批。3) 已建成涵盖内、外、妇、儿等多个学科,186个病种的综合性生物样本库,已保存样本18.59万人,样本管数近115.93万管。 4)已建成肝移植、恶性肿瘤、产前出生缺陷和罕见病等四大特色库和组织芯片高端库。具有理念先进、设施完善的场所设施建设及仪器设备的配置,具有BSL-2生物安全II级实验室备案资质,具有规范的管理制度及质量体系四级文件、不同类型的SOP文件等。3. 基因诊断中心数据库国家基因检测技术应用示范中心,转化医学与创新药物国家重点实验室——东北地区药物研究分中心,目前已产生肿瘤、遗传病、药物基因组学、病原类相关研究及临床应用类测序数据约1.2PB。 4.梅河队列 以梅河口市70万居民为框架人群的吉林省首个自然人群队列,现已完成如下工作进展:一是方案论证。2024年1月18日,组织召开项目研究讨论会,邀请中国工程院院士陈香美等多位领域内专家学者就研究实施方案的科学性和可行性进行论证。二是合法合规。项目研究方案于2024年3月8日、3月13日、3月21日先后完成科学性审查、伦理审查及国家医学研究登记备案系统的备案工作,确保研究开展的合法合规性。三是基础建设。2024年3月起逐步进行梅河健康研究院的基础建设工作。在吉林大学第一医院梅河医院划分1200平方米办公场地,500平方米生物样本保藏场地,按照“实用、节约、集约”的思路,积极开展改建。全部基建及设备安装工作已在9月初完成,现已投入使用。四是信息化建设。开展第一阶段信息系统的调研、参数确定、招标及搭建工作,基线调查系统和生物样本管理系统即将投入使用。五是生物样本库和实验室建设。拟在吉大一院梅河医院肿瘤中心建设350平米标本库实验室,设有P2实验室和细胞间。同一楼层设350平米基因诊断中心,能够满足组学研究的需求。

基础设施

拥有国际标准化实验室面积1200平方米,现拥有吉林省唯一的超高通量测序平台、单细胞测序平台、16SrRNA测序平台。建有高通量测序平台12个、基因分析平台2个、染色体核型分析平台1个、核酸质谱干台1个、基因芯片检测平台7套,各类高精尖设备100余台(套)。配备约12160核计算能力和约10.5PB存储,理论峰值性能为572000 GFLOPS。生物样本库超低温冰箱库区、特色库、质控实验室区、-160度液氮库区及冰箱库区等约1100平方米。

中心负责人

吕国悦,吉林大学第一医院党委书记,主任医师,教授。 吉林大学第一医院器官移植中心主任、普通外科中心主任。第十四届全国人大代表,全国优秀共产党、2022年冬奥会火炬手。享受国务院特殊津贴,获吉林省科技进步奖一等奖、中国医师奖等多项荣誉。 担任中国科技期刊卓越行动计划高起点期刊eGastroenterology 主编、中华消化外科杂志副总编辑。 兼任中华医学会器官移植分会常务委员、中国医师协会器官移植医师分会常务委员等。从事普通外科医教研工作20余年,率领团队完成肝移植手术800余例。作为项目负责人获得国家自然科学基金区域联合重点项目、国家自然科学基金委专项项目等项目。主译首部中文版《孟德尔随机化-基于遗传变异的因果推断方法》著作,以通讯作者或第一作者于Gut、Journal of Hepatology、Hepatology、American Journal of Transplantation等杂志发表多篇SCI论文。

国家基因组科学数据中心病原微生物分中心

国家基因组科学数据中心病原微生物分中心成立于2024年8月,依托单位为广东省疾病预防控制中心。

建设目标

建设完备的病原微生物基因组数据库,推动病原微生物基因组数据共享; 开发病原微生物基因组科学相关算法、工具和流程; 开展病原微生物基因组科学相关科普、成果推广; 开展创新型应用型研究,培养疾控领域亟需的生物信息学人才。

特色资源

1、“广东省人间传染的病原微生物菌(毒)种保藏中心”菌毒种实体资源库。2、传染病病原体基因组数据资源。3、新发突发及罕见输入性传染病病原体数据资源。

研究方向

1、病原微生物基因组科学数据资源标准化体系。2、基于病原微生物基因组数据的快速基因特征分析及分子溯源算法。3、构建基于基因组序列和流行病学信息的病原体传播动力学模型。

中心负责人

李柏生

国家基因组科学数据中心海洋生物基因组分中心

国家基因组科学数据中心海洋生物基因组分中心成立于2024年12月,依托单位为烟台大学。

建设目标

构建海洋生物基因组科学数据资源体系,推动海洋生物基因组科学数据的高效利用与共享。

研究方向

1、海洋生物基因组科学数据资源标准化体系。2、海洋生物基因组科学数据高性能计算平台建设。3、海洋特色生物资源多功能复合平台产业化建设。4、海洋生物前沿交叉智能计算服务平台。

特色资源

1、中国海潮间带生物基因组数据资源(软体动物、藻类等)。2、潮间带特色生物资源养护的海洋监测设备与数据系统。3、南极生物基因组数据资源。4、海洋病原生物基因组及环境DNA数据资源。

中心负责人

王绪敏,男,1976年3月出生,烟台大学教授,博士,博士生导师,烟台大学“拔尖人才”,烟台市“双百人才”入选者,烟台市C类重点人才。烟台大学青年创新人才协会理事长,烟台市青年科技志愿者服务队队长,烟台大学学术委员会委员。中国生物信息学会数据资源委员会委员、中国遗传学会教育教学委员会委员、中国中西医结合学会分子生药学专业委员会委员、山东省生物化学与分子生物学副理事长。

北京市朝阳区北辰西路一号院104号 中国北京,100101 | 86-10-84097216

版权所有 © 国家生物信息中心 2023, 京ICP备 10050270号-13