首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

垂直搜索引擎在团购网站中的研究与应用

摘要第5-6页
Abstract第6-7页
1 绪论第10-13页
    1.1 课题的研究背景与意义第10-11页
    1.2 课题的设计目标第11-12页
    1.3 论文章节安排第12-13页
2 搜索引擎原理分析第13-20页
    2.1 通用搜索引擎第13-17页
        2.1.1 搜索引擎概念第13-14页
        2.1.2 搜索引擎组成及工作原理第14-15页
        2.1.3 搜索引擎分类第15-16页
        2.1.4 搜索引擎发展历史第16页
        2.1.5 搜索引擎发展方向第16-17页
    2.2 垂直搜索引擎第17-19页
        2.2.1 垂直搜索引擎定义第17页
        2.2.2 垂直搜索引擎的优势第17页
        2.2.3 垂直搜索引擎的国内外现状第17页
        2.2.4 垂直搜索引擎与通用搜索引擎的比较第17-19页
    2.3 本章小结第19-20页
3 系统关键性技术研究第20-34页
    3.1 垂直网络爬虫技术第20-22页
        3.1.1 网络蜘蛛工作原理第20-22页
        3.1.2 网络蜘蛛页面抓取策略第22页
    3.2 网页信息抓取技术第22-23页
        3.2.1 抓取技术简介第22-23页
        3.2.2 抓取工具HtmlParser简介第23页
    3.3 主题相关度判断技术第23-25页
        3.3.1 布尔模型第24页
        3.3.2 空间向量模型第24-25页
    3.4 网页相关度分析技术第25-27页
        3.4.1 标准PageRank算法第25-27页
    3.5 索引技术与检索技术第27-32页
        3.5.1 Lucene简介第28页
        3.5.2 Lucene组织结构第28-29页
        3.5.3 Lucene索引文件格式第29-30页
        3.5.4 Lucene倒排索引技术第30-31页
        3.5.5 选择Lucene缘由第31-32页
    3.6 缓存技术第32-33页
        3.6.1 OSCache简介第32-33页
    3.7 本章小结第33-34页
4 系统总体设计第34-46页
    4.1 需求分析第34页
    4.2 系统总体架构第34-35页
    4.3 系统开发环境第35-36页
    4.4 网络蜘蛛爬虫设计第36-41页
        4.4.1 网络蜘蛛总体流程第36-37页
        4.4.2 种子URL选定第37-40页
        4.4.3 网页信息抽取的设计第40-41页
    4.5 索引模块与数据库的设计第41-43页
        4.5.1 建立索引文件第41-42页
        4.5.2 数据库的设计第42-43页
    4.6 缓存模块的设计第43-45页
    4.7 本章小结第45-46页
5 系统详细设计第46-62页
    5.1 网络蜘蛛爬虫的实现第46-51页
    5.2 网络信息抽取的实现第51-53页
    5.3 索引模块的实现第53-55页
    5.4 检索模块的实现第55-60页
        5.4.1 检索模块工作流程第55-56页
        5.4.2 检索工具类的实现第56-57页
        5.4.3 检索接口的实现第57-60页
    5.5 缓存模块的实现第60-61页
    5.6 本章小结第61-62页
6 总结与展望第62-64页
    6.1 总结第62-63页
    6.2 问题与展望第63-64页
参考文献第64-66页
致谢第66-67页
个人简历第67页
攻读硕士期间发表的学术论文第67页

论文共67页,点击 下载论文
上一篇:大洋样品仓库信息化管理的研究
下一篇:视频监控中运动目标检测与跟踪方法的研究