《人民日报》社论词汇统计与分析
| 摘要 | 第4-6页 |
| Abstract | 第6-7页 |
| 引言 | 第10-15页 |
| 一、研究现状 | 第10-12页 |
| 二、研究目的及意义 | 第12-13页 |
| 三、研究思路与方法 | 第13-15页 |
| 第一章 社论数据库建设 | 第15-21页 |
| 第一节 纸质文本扫描转换成电子语料库 | 第15-16页 |
| 一、纸质文本的扫描 | 第15-16页 |
| 二、扫描结果的转换 | 第16页 |
| 第二节 语料库篇数、字数的统计 | 第16-21页 |
| 一、篇数的统计 | 第16页 |
| 二、字数的统计 | 第16-21页 |
| 第二章 人工辅助的计算机分词与统计 | 第21-30页 |
| 第一节 社论分词理论及标准 | 第21-23页 |
| 一、词的定义 | 第21-22页 |
| 二、词的界定标准 | 第22-23页 |
| 第二节 分词实践 | 第23-26页 |
| 一、分词技术 | 第23-24页 |
| 二、分词细则 | 第24-26页 |
| 第三节 词条、词数统计 | 第26-30页 |
| 一、词数统计 | 第26-27页 |
| 二、词条统计 | 第27-30页 |
| 第三章 基于逐年数据库的比较与分析 | 第30-77页 |
| 第一节 高频词年份表的生成与分析 | 第30-73页 |
| 一、高频词的统计 | 第30-72页 |
| 二、高频词表的特点 | 第72-73页 |
| 第二节 敏感词所反映的汉语发展脉络 | 第73-77页 |
| 一、敏感词的统计 | 第73-74页 |
| 二、敏感词反映的词汇系统发展面貌 | 第74-77页 |
| 结语 | 第77-78页 |
| 参考文献 | 第78-80页 |
| 攻读硕士期间发表的论文目录 | 第80-81页 |
| 致谢 | 第81-82页 |