首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

理论科研成果垂直搜索引擎的研究与实现

摘要第4-5页
Abstract第5页
1 绪论第8-13页
    1.1 选题背景及意义第8-9页
    1.2 国内外研究现状及发展第9-11页
        1.2.1 垂直搜索引擎概述第9-10页
        1.2.2 国内研究概况第10页
        1.2.3 国外研究概况第10-11页
    1.3 研究内容第11页
    1.4 论文章节安排第11-13页
2 理论科研成果垂直搜索引擎关键技术第13-21页
    2.1 基于爬虫的搜索引擎工作原理第13-15页
    2.2 面向领域的垂直搜索特点第15页
    2.3 垂直搜索关键技术第15-18页
        2.3.1 主题爬虫技术第15-16页
        2.3.2 中文分词第16-17页
        2.3.3 检索结果排序机制第17-18页
    2.4 相关开源工具第18-20页
        2.4.1 Lucene第18-19页
        2.4.2 Heritrix第19-20页
        2.4.3 HTMLParser第20页
    2.5 本章小结第20-21页
3 理论科研成果搜索引擎系统设计第21-32页
    3.1 需求分析第21页
    3.2 理论科研成果垂直搜索引擎系统总体设计第21-25页
        3.2.1 系统总体设计及流程第21-24页
        3.2.2 网页结构化第24-25页
    3.3 系统关键算法设计及改进第25-31页
        3.3.1 爬虫爬行策略第25-28页
        3.3.2 消重与去重第28-30页
        3.3.3 网页去噪第30-31页
    3.4 本章小结第31-32页
4 理论科研成果垂直搜索引擎系统的实现第32-48页
    4.1 系统开发环境及工具第32页
    4.2 网页结构化与网络爬虫模块的实现第32-35页
        4.2.1 网页结构化的实现第32-33页
        4.2.2 爬虫模块的实现第33-35页
    4.3 网络分析模块的实现第35-42页
        4.3.1 消重与去重功能的实现第35-38页
        4.3.2 网页去噪功能的实现第38-42页
    4.4 索引和查询的实现第42-47页
        4.4.1 索引模块的实现第42-46页
        4.4.2 查询模块的实现第46-47页
    4.5 本章小结第47-48页
5 系统测试结果分析第48-51页
    5.1 测试结果及分析第48-50页
    5.2 本章小结第50-51页
结论第51-52页
参考文献第52-54页
攻读硕士学位期间发表学术论文情况第54-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:基于启发式最短路径的PAC任务调度算法
下一篇:短期气候预测业务系统设计与实现