基于茅盾文学奖抽样语料库的习用语研究
中文摘要 | 第8-9页 |
ABSTRACT | 第9-10页 |
第一章 绪论 | 第11-20页 |
1.1 选题背景 | 第11-13页 |
1.2 研究现状 | 第13-17页 |
1.2.1 习用语的词汇学研究 | 第13-14页 |
1.2.2 习用语与成语 | 第14-15页 |
1.2.3 习用语与熟语 | 第15-16页 |
1.2.4 习用语与惯用语 | 第16-17页 |
1.3 习用语的界定 | 第17-18页 |
1.4 指导理论和研究方法 | 第18-20页 |
第二章 茅盾文学奖抽样语料库的构建与标注 | 第20-25页 |
2.1 选材原则与抽样方法 | 第20-22页 |
2.1.1 选材原则 | 第20-21页 |
2.1.2 抽样方法 | 第21页 |
2.1.3 抽样结果 | 第21-22页 |
2.2 自动分词与词性标注 | 第22-25页 |
2.2.1 分词软件和词类代码 | 第22页 |
2.2.2 基本统计数据 | 第22-25页 |
第三章 自动标注的“习用语”情况分析 | 第25-35页 |
3.1 错标为习用语的词 | 第25-28页 |
3.2 错标为习用语的成语 | 第28-33页 |
3.3 错标为习用语的惯用语 | 第33-35页 |
第四章 习用语的定量定性分析 | 第35-49页 |
4.1 双音节习用语 | 第35-36页 |
4.2 三音节习用语 | 第36-40页 |
4.2.1 作独立语的三音节习用语 | 第36-37页 |
4.2.2 作其他句法成分的三音节习用语 | 第37-40页 |
4.3 四音节习用语 | 第40-45页 |
4.3.1 作独立语的四音节习用语 | 第40-41页 |
4.3.2 作其他句法成分的四音节习用语 | 第41-45页 |
4.4 五音节及以上习用语 | 第45页 |
4.5 自动分词优化建议 | 第45-49页 |
第五章 结语与课题展望 | 第49-50页 |
附录 | 第50-58页 |
附录一. 语料库中被《现代汉语词典》收录的习用语 | 第50-54页 |
附录二. 语料库中被标注为习用语的成语 | 第54-56页 |
附录三. 语料库中被标注为习用语的惯用语 | 第56-58页 |
参考文献 | 第58-60页 |
致谢 | 第60-61页 |
学位论文评阅及答辩情况表 | 第61页 |