关于本刊
-
主管单位:中国社会科学院
主办单位:中国社会科学院图书馆
社会科学文献出版社
出版单位:社会科学文献出版社
主 编:王 岚
常务副主编:巩文
副主编: 初景利(执行)王继民
ISSN:2096-6695
CN:10-1611/G2
您当前的位置:首页 >> 基于章节段落的学术文献结构功能识别方法研究
基于章节段落的学术文献结构功能识别方法研究
摘要: | 摘 要:[目的/意义]学术文献的结构功能识别问题是学术大数据知识挖掘与分析的研究热点,研究如何从中挖掘有效的知识,有助于从更深层次、更细粒度理解学术文献,从而促进学术文献语义理解的发展。[方法/过程] 以学术文献的章节段落为研究对象,对卷积神经网络(CNN)、长短期记忆网络 (LSTM)、来自变换器的双向编码器表征量(BERT)等深度学习模型的学术文献章节段落的结构功能识别性能进行比较研究,并与传统机器学习算法 SVM 进行了对比实验。[结果/结论]中国知网语料集上的实验结果表明,与 SVM 和 LSTM、CNN 模型相比,BERT 模型具有更优的结构功能识别性能,其在整体识别性能上F1值达到0.66,在具体结构功能的识别性能上F1值最高达到0.79。此外,通过引入混淆矩阵, 对功能结构误识情况进行分析。 |
作者: | 刘忠宝1,2 王宇飞3 赵文娟1,2 |
作者单位: | 1. 云计算与物联网技术福建省高等学校重点实验室(泉州信息工程学院), 泉州 362000;2. 北京语言大学语言智能研究院,北京 100083; 3. 中北大学软件学院,太原 030051 |
期刊: | 文献与数据学报 |
年.(期):页码 | 2020.(3):37-47 |
中图分类号: | G256 |
DOI: | 10.31193/SSAP.J.ISSN.2096-6695.2020.03.04 |
关键词: | 结构功能 学术文献 章节段落 深度学习 识别方法 |
欢迎阅读《文献与数据学报》!您是该文第4590位读者! |
版权所有 © 中国社会科学院图书馆 《文献与数据学报》编辑部
地址:北京市东城区建国门内大街5号 邮编:100732 技术支持电话:010-85195283、010-85195300、010-65276340
本系统由北京博渊星辰网络科技有限公司设计开发 技术支持电话:010-63361626