CareVault医疗领域知识图谱构建

案例概述

使用知识工场快速构建实体识别和实体关系识别模型,从海量文本中识别实体和实体关系,抽取的实体和实体关系,用于构建知识图谱。

 

客户介绍

CareVault,东软智能医疗研究云平台,以云模式提供AI工具和数据集,不断构建、优化和积累高质量的样本数据和认知模型,为医生提供辅助医疗与科研的服务平台,为医院等科研机构提供基于人工智能与大数据方法论和工具的科研平台,为医疗机构、科研院所提供科研成果产业化的孵化平台。

 

面临挑战

医院或者医疗单位有大量电子病历和影响报告等医疗数据,医生或者医疗科研人员希望基于这些医疗数据构建医疗领域知识图谱,用于辅助医生诊疗。构建图谱需要从海量的医疗数据中识别实体和实体关系,如何快速、高效的构建实体识别和实体关系识别模型,成为构建知识图谱的关键。中国医疗资源相对匮乏,提高医生的工作效率,可以从一定程度上缓解医疗资源紧张的问题,构建医生辅助诊疗工具可以有效提高医生工作效率。

 

解决方案

构建知识图谱的关键是从文本中识别出实体类别和实体关系,通过知识工场对电子病历和影像报告等医疗文本数据中的实体类别和实体关系进行标注,获得的标注数据用于训练实体识别和实体关系模型,使用实体识别和实体关系识别模型从海量医疗数据中抽取实体和实体关系,用于医疗知识图谱构建。具体方案如下:

  • 医疗数据实体类别及实体关系标注

在DeepCogni Studio知识工场中依次上传医疗文本数据、创建实体类别和实体关系标签集、创建实体类别和实体关系标注任务,针对标注任务中的实体类别和实体关系进行标注。在标注过程中,可以不断的训练实体类别和实体关系模型,并使用训练的模型进行预标注,标注者在预标注结果上进行人工标注,提高人工标注效率。

  • 实体识别和实体关系识别模型训练

当标注任务中的所有语料都标注完成之后,使用标注的实体类别和实体关系语料,在知识DeepCogni Studio知识工场中的模型管理中创建训练模型。

  • 模型发布及使用

当训练的实体识别和实体关系识别模型准确度不符合实体识别和关系识别需求时,重复上面的1)和2)步操作,当模型符合要求时,将符合标准的模型发布到DeepCogni知识服务平台,用户通过API调用模型,从海量医疗文本数据中识别实体和实体关系。

  • 构建图谱

将抽取出来的实体和实体关系,构建医疗领域知识图谱。

 

实施效果

知识工场的迭代式标注流程,帮助用户快速生成实体识别和实体关系识别模型,提高了医疗领域知识图谱的构建效率,节省了时间和人力成本。

 

相关产品

2019-08-09T18:37:35+00:00