首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于统计模型的搜索引擎查询纠错系统

摘要第2-3页
Abstract第3页
1 绪论第6-11页
    1.1 背景与意义第6-7页
    1.2 研究现状分析第7-8页
    1.3 本文主要工作第8-10页
    1.4 全文组织结构第10-11页
2 相关技术概述第11-16页
    2.1 搜索引擎技术第11-12页
        2.1.1 搜索引擎的工作原理第11-12页
    2.2 自然语言处理技术与搜索引擎第12-13页
    2.3 查询纠错技术第13-14页
        2.3.1 中文查询纠错技术第13页
        2.3.2 英文查询纠错技术第13-14页
    2.4 中文分词技术第14-15页
    2.5 Thrift框架第15页
    2.6 Lucene开源搜索引擎工具第15页
    2.7 本章小结第15-16页
3 统计模型的建立与应用第16-25页
    3.1 候选概率计算第16-19页
        3.1.1 N-gram语言模型第16-17页
        3.1.2 N-gram模型训练第17-19页
    3.2 数据平滑第19-21页
        3.2.1 Add-one Smoothing算法第20页
        3.2.2 Add-k Smoothing算法第20-21页
        3.2.3 不同平滑算法实验对比第21页
    3.3 候选词的确定第21-24页
        3.3.1 隐马尔科夫模型第21-23页
        3.3.2 Viterbi算法的应用第23-24页
    3.4 本章小结第24-25页
4 查询纠错方法的设计与分析第25-45页
    4.1 纠错数据获取与处理第25-28页
        4.1.1 日志数据提取第25-26页
        4.1.2 纠错语料处理第26-27页
        4.1.3 查询错误类型第27-28页
    4.2 查询纠错方法总体分析第28-31页
    4.3 查询预处理第31-33页
    4.4 纠错判断阶段第33-34页
    4.5 查询纠错方法详细设计第34-44页
        4.5.1 重写纠错模块第34-35页
        4.5.2 英文纠错模块第35-38页
        4.5.3 拼音纠错模块第38-42页
        4.5.4 编辑距离纠错模块第42-44页
    4.6 本章小结第44-45页
5 效果分析及系统实现第45-55页
    5.1 纠错效果分析第45-51页
        5.1.1 评价指标第45页
        5.1.2 纠错效果数据展示第45-48页
        5.1.3 纠错类型覆盖效果展示第48-51页
        5.1.4 单独查询纠错效果分析第51页
    5.2 系统设计与实现第51-54页
        5.2.1 语言及环境第51-52页
        5.2.2 系统总体设计第52-53页
        5.2.3 纠错系统前端展示第53-54页
    5.3 本章小结第54-55页
结论第55-56页
参考文献第56-59页
致谢第59-61页

论文共61页,点击 下载论文
上一篇:基于银行凭证的金融数据分析系统设计与实现
下一篇:基于复合信息的协同过滤推荐