

关于本刊
-
主管单位:中国社会科学院
主办单位:中国社会科学院图书馆
社会科学文献出版社
出版单位:社会科学文献出版社
主 编:王 岚
常务副主编:巩文
副主编: 初景利(执行)王继民
ISSN:2096-6695
CN:10-1611/G2
您当前的位置:首页 >> 搭配强度计算公式的特点与应用——以国际中文教育为例
搭配强度计算公式的特点与应用——以国际中文教育为例



摘要: | [目的/意义]分析搭配强度计算公式在汉语窗口搭配和依存搭配自动提取中的特点和性能差异,旨在为汉语搭配研究和国际中文教育提供参考。[方法/过程]选取 7 种典型的搭配强度计算公式,从真实语料库中为 60 个典型的词语提取窗口搭配和依存搭配,邀请专家进行评分验证后,分析不同公式的性能表现。[结果/结论]面向国际中文教育时,公式 Dice 系数、MI3 和对数似然比在搭配提取中表现较好,而互信息和搭配词频次表现较差,依存搭配提取的精确率普遍高于窗口搭配,并用 MI3 和 Dice 系数可以取得最高召回率,但仍难以达到 100%。研究结果为搭配强度计算公式的选择和搭配提取工具的研制提供了依据。 |
作者: | 张永伟 梁敬芝 |
作者单位: | (1. 中国社会科学院语言研究所语料库暨计算语言学研究中心,北京 100732;2. 中国社会科学院大学国际教育学院,北京 100102) |
期刊: | 文献与数据学报 |
年.(期):页码 | 2025.(2):69-83 |
中图分类号: | TP391.1 H195 |
DOI: | 10.31193/SSAP.J.ISSN.2096-6695.2025.02.06 |
关键词: | 窗口搭配 依存搭配 搭配强度计算公式 语料库 |
欢迎阅读《文献与数据学报》!您是该文第26位读者! |
版权所有 © 中国社会科学院图书馆 《文献与数据学报》编辑部
地址:北京市东城区建国门内大街5号 邮编:100732 技术支持电话:010-85195283、010-85195300、010-65276340
本系统由北京博渊星辰网络科技有限公司设计开发 技术支持电话:010-63269626