殷晓君1 邵艳秋2
1. 北京语言大学国际中文教育研究院/国际中文学院
2. 北京语言大学信息科学学院
摘要:语义对文本复杂度的影响至关重要。本文聚焦中文文本语义复杂度特征,提出“语义依存构式”这一概念,将其作为文本分析的基本单位,构建出基于语义依存构式的中文文本复杂度特征体系;随后使用语义依存分析等自然语言处理技术对语义依存构式及其复杂度特征进行自动抽取和计算;最后,在文本复杂度分级任务中引入句法依存构式复杂度特征,对句法依存构式复杂度特征和语义依存构式复杂度特征分别构建机器学习模型,进行文本复杂度自动分级实验。实验结果显示,相较于句法依存构式复杂度特征,语义依存构式复杂度特征在中文文本复杂度分级任务中有更好表现。
关键词:语义复杂度;语义依存构式;特征;机器学习;