首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

搜索引擎纠错算法研究与纠错Bad Case挖掘

摘要第1-5页
Abstract第5-8页
1 绪论第8-11页
   ·课题研究背景与意义第8页
   ·国内外研究现状第8-9页
   ·本文主要工作第9-11页
2 自动纠错相关技术综述第11-23页
   ·搜索引擎概述第11-17页
     ·搜索引擎的发展第11-13页
     ·搜索引擎的原理与结构第13-15页
     ·搜索引擎的技术目标第15-16页
     ·自然语言处理技术在搜索引擎中的应用第16-17页
   ·中文分词技术第17-23页
     ·中文特点第17-18页
     ·中文分词第18-21页
     ·中文纠错技术第21-23页
3 统计语言模型的建立第23-37页
   ·统计语言模型第23-24页
   ·N值的选定第24-27页
   ·语言模型的建立第27-28页
   ·训练语料库第28-33页
     ·语料库的建立第28页
     ·不同n值概率的计算第28-33页
     ·数据稀疏问题第33页
   ·数据平滑技术第33-37页
     ·齐普夫定律第33-34页
     ·加值平滑技术第34页
     ·One-Count平滑技术第34-35页
     ·错误检测与纠错第35-37页
4 纠错Bad Case挖掘第37-47页
   ·错误纠错词Bad Case挖掘第37-42页
     ·分析检索日志第38-41页
     ·量化建模计算第41-42页
   ·未给出纠错词Bad Case挖掘第42-47页
     ·检索日志序列特征分析第42-44页
     ·量化建模计算第44-47页
5 实验结果与分析第47-54页
   ·实验环境第47-48页
     ·开源搜索引擎第47页
     ·检索库与关键词测试集合第47-48页
   ·实验效果评价标准第48-49页
   ·实验统计数据展示第49-53页
     ·建立N-gram模型的统计数据第49-50页
     ·平滑技术优化后的统计数据第50-51页
     ·挖掘纠错Bad Case第51-53页
   ·实验结果分析第53-54页
结论第54-55页
参考文献第55-57页
攻读硕士学位期间参与科研项目情况第57-58页
致谢第58-59页

论文共59页,点击 下载论文
上一篇:基于机器学习的药名实体识别及药物关系抽取
下一篇:皇姑地税局内网网站系统设计与实现