基于线性回归的中文文本可读性预测方法研究

摘要	第4-6页
Abstract	第6-7页
第一章绪论	第10-16页
1.1 背景和意义	第10-12页
1.2 可读性研究的发展历史	第12-14页
1.3 本文的主要工作	第14-15页
1.4 本文的组织结构	第15-16页
第二章文本可读性预测问题的介绍	第16-32页
2.1 文本可读性预测的概述	第16页
2.2 现有可读性预测研究方法的总结	第16-28页
2.2.1 基于传统的文本特征的可读性公式方法	第17-19页
2.2.2 基于认知理论的方法	第19-23页
2.2.3 基于单词统计的语言模型方法	第23-25页
2.2.4 基于复杂特征与机器学习的方法	第25-28页
2.3 特征选择	第28-30页
2.4 本章小结	第30-32页
第三章基于线性回归模型与特征选择的可读性预测方法	第32-46页
3.1 方法的动机	第32-33页
3.2 方法的框架	第33页
3.3 中文特征计算	第33-38页
3.3.1 数据预处理	第34页
3.3.2 分词和词性标注	第34-35页
3.3.3 语法分析	第35页
3.3.4 计算得到的中文可读性特征	第35-38页
3.4 特征选择	第38-41页
3.4.1 基于排序的特征选择	第38-40页
3.4.2 考虑冗余的特征选择	第40-41页
3.4.3 考虑组合特征的特征选择	第41页
3.5 线性回归模型	第41-42页
3.6 方法的设计与实现	第42-44页
3.6.1 方法的设计	第42-43页
3.6.2 方法的实现	第43-44页
3.7 本章小结	第44-46页
第四章实证研究	第46-60页
4.1 研究问题	第46页
4.2 数据集	第46-47页
4.3 实验设计	第47-48页
4.3.1 实验设置	第47-48页
4.3.2 评价指标	第48页
4.4 实验结果分析	第48-58页
4.4.1 基于设计特征的线性回归模型vs SVR	第49-52页
4.4.2 基于线性回归与特征选择的中文文本可读性预测方法的研究	第52-58页
4.5 本章小结	第58-60页
第五章总结与展望	第60-64页
5.1 总结	第60-61页
5.2 展望	第61-64页
致谢	第64-66页
参考文献	第66-72页
攻读硕士学位期间发表论文及参与项目情况	第72-73页