知识图谱平台的工作主要包括遗传病相关数据库的数据整合与融合,结构化病历数据的关联分析与聚类融合,知识图谱潜在关系信息的分析与挖掘,以及遗传知识图谱在人机对话等AI应用场景下的数据关联分析与决策分析, 语言逻辑推理等研究工作。目前,平台的主要工作是对遗传病相关数据库的数据分析与融合,和知识图谱的图数据图检索研究。
当前,我们的遗传知识图谱已整合了包括疾病,临床表型, 变异, 药物, 医学文献, 基因,罕见病等遗传相关的16个数据库。其中图谱覆盖了9017种遗传病和10418种罕见病的数据信息,以及14832种遗传相关临床表型术语。另外,图谱还针对以上类型的疾病融合关联了已知基因功能的43401个基因信息和近90万条基因变异与染色体变异的数据信息,包括了人类基因的位点突变,拷贝数变异,染色体结构变异等导致疾病的所有相关变异信息。