首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于统计语言模型的搜索引擎输入纠错技术研究

摘要第6-7页
Abstract第7-8页
第1章 绪论第13-17页
    1.1 研究背景与意义第13-14页
    1.2 研究现状分析第14-15页
    1.3 主要研究内容第15页
    1.4 本文组织结构第15-17页
第2章 全文搜索及其应用技术概述第17-33页
    2.1 全文检索关键技术概述第17-24页
        2.1.1 索引技术概况第17-19页
        2.1.2 倒排索引概况第19-20页
        2.1.3 倒排索引索引性能模型第20-22页
        2.1.4 倒排索引文件的压缩技术第22-24页
        2.1.5 倒排索引性能与功能分析第24页
    2.2 Lucene介绍第24-28页
        2.2.1 Lucene简介第24-25页
        2.2.2 Lucene系统结构第25-26页
        2.2.3 Lucene索引机制第26-27页
        2.2.4 Lucene的分词第27-28页
    2.3 理论模型和实验平台搭建的选择第28页
    2.4 Nutch+Hadoop实验平台第28-32页
        2.4.1 Nutch+Hadoop简介第28-31页
        2.4.2 实验环境第31页
        2.4.3 系统架构第31-32页
    2.5 本章小结第32-33页
第3章 统计语言模型的建立与分析第33-45页
    3.1 基于N-gram的语言模型第33-34页
    3.2 N值的选定第34-35页
    3.3 模型的建立第35-37页
    3.4 数据稀疏问题第37-38页
        3.4.1 齐普夫(Zipf)定律第37页
        3.4.2 平滑技术的引入第37-38页
    3.5 输入关键词的分析与统计信息的比较第38-40页
    3.6 实验数据集第40页
    3.7 实验数据统计第40-43页
        3.7.1 初始状态下的查询成功率第41页
        3.7.2 建立语言模型后的数据分析第41-43页
    3.8 本章小结第43-45页
第4章 关键词的权重统计比较第45-49页
    4.1 TF-IDF公式介绍第45-46页
    4.2 权重的分析比较第46-47页
    4.3 实验数据统计第47-48页
    4.4 本章小结第48-49页
第5章 全文总结与研究展望第49-53页
    5.1 全文总结第49-50页
    5.2 进一步研究第50-53页
参考文献第53-55页
攻读硕士学位期间发表的论文情况第55-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:MIMO-WPDM多载波通信系统关键技术研究
下一篇:基于SINOVATION的深V型游艇快速建模系统的设计与实现