知识图谱

病历中的各种有用信息都以文本的形式记录,只有医生才能看懂,但是把“医生看懂”提升到“计算机能看懂”,还需要我们理解病历中文本的含义,尤其是针对诊疗的业务需求来抽取相关的知识点。我们把针对业务场景抽取相应的知识点让计算机能够进一步分析和推理,称之为病历结构化,从病历文本中抽取出的知识点建立知识图谱。

更新日志

  • V2.4
    2020-12-15 15:00
    版本更新:
    1. 更新实体链接支持模块
    2. 更新图谱知识推理模块
  • V2.3
    2020-10-1 17:00
    版本更新:
    1. 重构图谱本体框架功能
    2. 优化图谱实体融合功能
  • V.2.2
    2020-5-11 10:30
    版本更新:
    我们对遗传知识图谱中的疾病与多个症状表型的表型频率进了主要性, 次要性等标注,大约增加了12w关系标注数据。其次,我们实现了基于图嵌入的病例知识特征量化描述,它可以用于遗传性疾病病例图谱数据的挖掘分析。
  • V.2.1
    2020-3-10 11:10
    版本更新:
    我们新增加了45000多条CNV变异数据,其次是实现了遗传疾病相关的文献数据的自动更新脚本。
  • V.2.0
    2019-11-03 10:00
    版本更新:
    我们对遗传图谱进行了遗传病相关文献数据更新,其中包括10万条基因文献数据,7万条遗传病相关文献数据,55万条突变相关文献数据。
  • V.1.6
    2019-10-14 10:00
    版本更新:
    我们对遗传病相关的基因突变数据进行了整合与规范化,其次,融合了与疾病相关的靶向基因药物化学数据。
  • V.1.3
    2019-09-01 08:00
    版本更新:
    我们对遗传知识图谱中多个不同来源的基因数据库进行了数据融合与数据结构规范化的整改。
  • V.1.1
    2019-08-05 08:00
    版本更新:
    我们对遗传知识图谱新添加了遗传病相关的靶向基因治疗药物数据。其次对遗传病知识图谱的部分数据关系进行了更新与维护。
  • V.1.0
    2019-07-02 10:05
    版本更新:
    我们首版遗传病知识图谱包括了近8000多种遗传病数据信息,其中包括了基因,变异,文献,临床表型等与遗传病相关的数据。
  • 2019-06-12 11:10
    项目上线:
    BioX产业院首个遗传病知识图谱构建计划方案正式启动。

平台介绍

知识图谱平台的工作主要包括遗传病相关数据库的数据整合与融合,结构化病历数据的关联分析与聚类融合,知识图谱潜在关系信息的分析与挖掘,以及遗传知识图谱在人机对话等AI应用场景下的数据关联分析与决策分析, 语言逻辑推理等研究工作。目前,平台的主要工作是对遗传病相关数据库的数据分析与融合,和知识图谱的图数据图检索研究。

当前,我们的遗传知识图谱已整合了包括疾病,临床表型, 变异, 药物, 医学文献, 基因,罕见病等遗传相关的16个数据库。其中图谱覆盖了9017种遗传病和10418种罕见病的数据信息,以及14832种遗传相关临床表型术语。另外,图谱还针对以上类型的疾病融合关联了已知基因功能的43401个基因信息和近90万条基因变异与染色体变异的数据信息,包括了人类基因的位点突变,拷贝数变异,染色体结构变异等导致疾病的所有相关变异信息。

数据量

  • 遗传疾病
    9173种
  • 罕见病
    10237种
  • 基因数据
    46752条
  • 变异数据
    1066831条
  • 表型术语
    15228条
  • 遗传病文献
    301105条
  • 药物种类
    13339种

Color Switcher