《人民日报》社论词汇统计与分析
摘要 | 第4-6页 |
Abstract | 第6-7页 |
引言 | 第10-15页 |
一、研究现状 | 第10-12页 |
二、研究目的及意义 | 第12-13页 |
三、研究思路与方法 | 第13-15页 |
第一章 社论数据库建设 | 第15-21页 |
第一节 纸质文本扫描转换成电子语料库 | 第15-16页 |
一、纸质文本的扫描 | 第15-16页 |
二、扫描结果的转换 | 第16页 |
第二节 语料库篇数、字数的统计 | 第16-21页 |
一、篇数的统计 | 第16页 |
二、字数的统计 | 第16-21页 |
第二章 人工辅助的计算机分词与统计 | 第21-30页 |
第一节 社论分词理论及标准 | 第21-23页 |
一、词的定义 | 第21-22页 |
二、词的界定标准 | 第22-23页 |
第二节 分词实践 | 第23-26页 |
一、分词技术 | 第23-24页 |
二、分词细则 | 第24-26页 |
第三节 词条、词数统计 | 第26-30页 |
一、词数统计 | 第26-27页 |
二、词条统计 | 第27-30页 |
第三章 基于逐年数据库的比较与分析 | 第30-77页 |
第一节 高频词年份表的生成与分析 | 第30-73页 |
一、高频词的统计 | 第30-72页 |
二、高频词表的特点 | 第72-73页 |
第二节 敏感词所反映的汉语发展脉络 | 第73-77页 |
一、敏感词的统计 | 第73-74页 |
二、敏感词反映的词汇系统发展面貌 | 第74-77页 |
结语 | 第77-78页 |
参考文献 | 第78-80页 |
攻读硕士期间发表的论文目录 | 第80-81页 |
致谢 | 第81-82页 |