首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于多源特征挖掘的查询纠错方法研究

摘要第3-4页
Abstract第4-5页
第一章 绪论第8-13页
    1.1 研究背景第8-9页
    1.2 国内外研究现状及趋势第9-10页
    1.3 主要研究内容第10-11页
    1.4 论文的组织结构第11-13页
第二章 相关技术介绍第13-19页
    2.1 搜索引擎概述第13-16页
        2.1.1 搜索引擎原理第13-14页
        2.1.2 搜索引擎的技术目标第14-15页
        2.1.3 搜索引擎存在的问题第15-16页
    2.2 中文查询纠错技术第16-19页
        2.2.1 自然语言处理第16-17页
        2.2.2 自然语言处理与搜索引擎第17页
        2.2.3 中文查询纠错技术第17-19页
第三章 数据处理第19-22页
    3.1 搜索引擎查询日志处理第19页
    3.2 词典与语料库第19-20页
    3.3 训练集第20页
    3.4 测试集第20-22页
第四章 查询纠错模型研究第22-32页
    4.1 混淆集生成模型第22-24页
    4.2 混淆集排序模型第24-28页
        4.2.1 N元语法模型第25-26页
        4.2.2 查询词点击率第26页
        4.2.3 N-gram相似度第26-27页
        4.2.4 编辑距离第27页
        4.2.5 混淆集排序模型的建立第27-28页
    4.3 实验过程及结果分析第28-32页
        4.3.1 评测指标第28页
        4.3.2 实验过程及结果分析第28-32页
第五章 BadCase挖掘模型研究第32-39页
    5.1 日志特征分析第32-33页
    5.2 量化建模第33-35页
        5.2.1 关联关系模型第34-35页
        5.2.2 点击记录模型第35页
    5.3 实验过程及结果分析第35-39页
        5.3.1 实验过程及结果第35-38页
        5.3.2 实验结果分析第38-39页
第六章 系统的设计与实现第39-49页
    6.1 系统架构设计第39-42页
        6.1.1 工具介绍第39-41页
        6.1.2 系统核心模块第41页
        6.1.3 系统总体设计第41-42页
    6.2 系统实现第42-49页
        6.2.1 Nutch抓取数据第42-43页
        6.2.2 Solr查询检索服务第43页
        6.2.3 查询纠错示例第43-49页
第七章 总结与展望第49-50页
参考文献第50-53页
在学期间的研究成果第53-54页
致谢第54页

论文共54页,点击 下载论文
上一篇:基于似物性度量的交通场景快速目标检测方法
下一篇:基于TVWS的海上无线宽带通信系统软件设计