9+

您当前的位置:首页 >> 搭配强度计算公式的特点与应用——以国际中文教育为例

搭配强度计算公式的特点与应用——以国际中文教育为例

查看全文 下载全文

摘要:

[目的/意义]分析搭配强度计算公式在汉语窗口搭配和依存搭配自动提取中的特点和性能差异,旨在为汉语搭配研究和国际中文教育提供参考。[方法/过程]选取 7 种典型的搭配强度计算公式,从真实语料库中为 60 个典型的词语提取窗口搭配和依存搭配,邀请专家进行评分验证后,分析不同公式的性能表现。[结果/结论]面向国际中文教育时,公式 Dice 系数、MI3 和对数似然比在搭配提取中表现较好,而互信息和搭配词频次表现较差,依存搭配提取的精确率普遍高于窗口搭配,并用 MI3 和 Dice 系数可以取得最高召回率,但仍难以达到 100%。研究结果为搭配强度计算公式的选择和搭配提取工具的研制提供了依据。

作者: 张永伟 梁敬芝
作者单位: (1. 中国社会科学院语言研究所语料库暨计算语言学研究中心,北京 100732;2. 中国社会科学院大学国际教育学院,北京 100102)
期刊: 文献与数据学报
年.(期):页码 2025.(2):69-83
中图分类号: TP391.1 H195
DOI: 10.31193/SSAP.J.ISSN.2096-6695.2025.02.06
关键词: 窗口搭配 依存搭配 搭配强度计算公式 语料库

欢迎阅读《文献与数据学报》!您是该文第26位读者!