搜索引擎纠错算法研究与纠错Bad Case挖掘

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-11页
·课题研究背景与意义	第8页
·国内外研究现状	第8-9页
·本文主要工作	第9-11页
2 自动纠错相关技术综述	第11-23页
·搜索引擎概述	第11-17页
·搜索引擎的发展	第11-13页
·搜索引擎的原理与结构	第13-15页
·搜索引擎的技术目标	第15-16页
·自然语言处理技术在搜索引擎中的应用	第16-17页
·中文分词技术	第17-23页
·中文特点	第17-18页
·中文分词	第18-21页
·中文纠错技术	第21-23页
3 统计语言模型的建立	第23-37页
·统计语言模型	第23-24页
·N值的选定	第24-27页
·语言模型的建立	第27-28页
·训练语料库	第28-33页
·语料库的建立	第28页
·不同n值概率的计算	第28-33页
·数据稀疏问题	第33页
·数据平滑技术	第33-37页
·齐普夫定律	第33-34页
·加值平滑技术	第34页
·One-Count平滑技术	第34-35页
·错误检测与纠错	第35-37页
4 纠错Bad Case挖掘	第37-47页
·错误纠错词Bad Case挖掘	第37-42页
·分析检索日志	第38-41页
·量化建模计算	第41-42页
·未给出纠错词Bad Case挖掘	第42-47页
·检索日志序列特征分析	第42-44页
·量化建模计算	第44-47页
5 实验结果与分析	第47-54页
·实验环境	第47-48页
·开源搜索引擎	第47页
·检索库与关键词测试集合	第47-48页
·实验效果评价标准	第48-49页
·实验统计数据展示	第49-53页
·建立N-gram模型的统计数据	第49-50页
·平滑技术优化后的统计数据	第50-51页
·挖掘纠错Bad Case	第51-53页
·实验结果分析	第53-54页
结论	第54-55页
参考文献	第55-57页
攻读硕士学位期间参与科研项目情况	第57-58页
致谢	第58-59页