关于本刊
-
主管单位:中国社会科学院
主办单位:中国社会科学院图书馆
社会科学文献出版社
出版单位:社会科学文献出版社
主 编:王 岚
常务副主编:巩文
副主编: 初景利(执行)王继民
ISSN:2096-6695
CN:10-1611/G2
您当前的位置:首页 >> BiLSTM-CRF 模型在中文电子病历命名实体识别中的应用研究
BiLSTM-CRF 模型在中文电子病历命名实体识别中的应用研究
摘要: | [目的/意义]健康医疗大数据是我国重要的基础性战略资源。中文电子病历的命名实体识别有助于从大量非结构化文本中提取重要信息,从而为医疗数据挖掘与应用奠定基础。[方法/过程]为探讨深度学习算法在中文电子病历命名实体识别中的效果,本研究通过标注语料集,建立BiLSTM-CRF模型对电子病历中症状、检查、疾病、药物、治疗五类实体进行了识别,并与传统CRF方法进行对比,同时对不同标注方案、标注粒度以及标注类别对模型识别效果的影响进行了分析。[结果/结论]BiLSTMCRF模型在基于词的BIOES标注方案下实体识别效果最好,F值为78.12%;从实体类别来看,检查类实体的识别效果最好,而疾病类实体的识别效果不太理想。 |
作者: | 王若佳1,2 魏思仪3 王继民1 |
作者单位: | 1. 北京大学信息管理系,北京 100871;2. 北京大学海洋研究院,北京 100871;3. 康奈尔大学信息科学学院,美国 14850 |
期刊: | 文献与数据学报 |
年.(期):页码 | 2019.(2):53-66 |
中图分类号: | TP393 |
DOI: | 10.31193/SSAP.J.ISSN.2096-6695.2019.02.05 |
关键词: | 深度学习 电子病历 命名实体识别 BiLSTM-CRF模型 条件随机场 |
欢迎阅读《文献与数据学报》!您是该文第5428位读者! |
版权所有 © 中国社会科学院图书馆 《文献与数据学报》编辑部
地址:北京市东城区建国门内大街5号 邮编:100732 技术支持电话:010-85195283、010-85195300、010-65276340
本系统由北京博渊星辰网络科技有限公司设计开发 技术支持电话:010-63361626