词和短语区分的频率因素--基于超大规模语料库2-gram串的考察
摘要 | 第1-7页 |
Abstract | 第7-10页 |
1 绪论 | 第10-17页 |
·研究现状 | 第11-14页 |
·传统研究 | 第11页 |
·“频率”相关研究 | 第11-13页 |
·“词”界定难点简析 | 第13-14页 |
·本文研究思路 | 第14-15页 |
·基于N-GRAM串验证存在的问题及解决方案 | 第15-17页 |
2 语料处理说明及N-GRAM串的选取 | 第17-23页 |
·说明 | 第17-18页 |
·N-GRAM串统计原理及N范围的选取 | 第18-23页 |
·n-gram的含义 | 第18-19页 |
·n-gram串中n的选取 | 第19-22页 |
·小结 | 第22-23页 |
3 高频二字串成词性考察 | 第23-33页 |
·二字串高频字串分段考察 | 第23页 |
·高频RANK 1-1000二字串属性分析 | 第23-29页 |
·Rank 1-250二字串属性分析 | 第23-25页 |
·Rank 251-500二字串属性分析 | 第25-27页 |
·Rank 501-750二字串属性分析 | 第27-28页 |
·Rank 751-1000二字串属性分析 | 第28-29页 |
·数据分析与小结 | 第29-33页 |
4 二字串粗分类频率考察 | 第33-41页 |
·不同结构二字串频率考察 | 第33-38页 |
·主谓式 | 第33-34页 |
·动宾式 | 第34-35页 |
·状中式 | 第35-36页 |
·定中式 | 第36页 |
·述补式 | 第36-37页 |
·并列式 | 第37-38页 |
·一些“类词串”的频率考察 | 第38-39页 |
·分析与总结 | 第39-41页 |
5 二字串细分类频率考察 | 第41-51页 |
·“同构槽”字串频率考察 | 第41-45页 |
·“动结式”与“动趋式”同构槽频率考察 | 第45-49页 |
·“V到” | 第46-47页 |
·“V向” | 第47-49页 |
·同义场同构槽字串频率考察 | 第49-50页 |
·亲属义场 | 第49页 |
·动物、身体义场 | 第49-50页 |
·分析与总结 | 第50-51页 |
6 结语 | 第51-52页 |
参考文献 | 第52-55页 |
附录1.现当代语料来源作家列表 | 第55-56页 |
附录2.频率最高的1000个二字串属性分析表 | 第56-65页 |
附录3.频率>1000次“大X”二字串属性分析表 | 第65-69页 |
攻读学位期间发表的学术论文 | 第69-70页 |
致谢 | 第70页 |