基于统计模型的搜索引擎查询纠错系统

摘要	第2-3页
Abstract	第3页
1 绪论	第6-11页
1.1 背景与意义	第6-7页
1.2 研究现状分析	第7-8页
1.3 本文主要工作	第8-10页
1.4 全文组织结构	第10-11页
2 相关技术概述	第11-16页
2.1 搜索引擎技术	第11-12页
2.1.1 搜索引擎的工作原理	第11-12页
2.2 自然语言处理技术与搜索引擎	第12-13页
2.3 查询纠错技术	第13-14页
2.3.1 中文查询纠错技术	第13页
2.3.2 英文查询纠错技术	第13-14页
2.4 中文分词技术	第14-15页
2.5 Thrift框架	第15页
2.6 Lucene开源搜索引擎工具	第15页
2.7 本章小结	第15-16页
3 统计模型的建立与应用	第16-25页
3.1 候选概率计算	第16-19页
3.1.1 N-gram语言模型	第16-17页
3.1.2 N-gram模型训练	第17-19页
3.2 数据平滑	第19-21页
3.2.1 Add-one Smoothing算法	第20页
3.2.2 Add-k Smoothing算法	第20-21页
3.2.3 不同平滑算法实验对比	第21页
3.3 候选词的确定	第21-24页
3.3.1 隐马尔科夫模型	第21-23页
3.3.2 Viterbi算法的应用	第23-24页
3.4 本章小结	第24-25页
4 查询纠错方法的设计与分析	第25-45页
4.1 纠错数据获取与处理	第25-28页
4.1.1 日志数据提取	第25-26页
4.1.2 纠错语料处理	第26-27页
4.1.3 查询错误类型	第27-28页
4.2 查询纠错方法总体分析	第28-31页
4.3 查询预处理	第31-33页
4.4 纠错判断阶段	第33-34页
4.5 查询纠错方法详细设计	第34-44页
4.5.1 重写纠错模块	第34-35页
4.5.2 英文纠错模块	第35-38页
4.5.3 拼音纠错模块	第38-42页
4.5.4 编辑距离纠错模块	第42-44页
4.6 本章小结	第44-45页
5 效果分析及系统实现	第45-55页
5.1 纠错效果分析	第45-51页
5.1.1 评价指标	第45页
5.1.2 纠错效果数据展示	第45-48页
5.1.3 纠错类型覆盖效果展示	第48-51页
5.1.4 单独查询纠错效果分析	第51页
5.2 系统设计与实现	第51-54页
5.2.1 语言及环境	第51-52页
5.2.2 系统总体设计	第52-53页
5.2.3 纠错系统前端展示	第53-54页
5.3 本章小结	第54-55页
结论	第55-56页
参考文献	第56-59页
致谢	第59-61页