首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于电路课程的主题搜索引擎设计与实现

摘要第5-6页
ABSTRACT第6页
第一章 绪论第11-17页
    1.1 引言第11-12页
    1.2 搜索引擎的发展概况第12-14页
    1.3 国内外研究及发展现状第14-15页
    1.4 基于电路课程的主题搜索引擎的设计与本文组织结构第15-17页
第二章 主题搜索引擎的关键技术第17-29页
    2.1 主题搜索引擎功能模块第17-18页
    2.2 中文分词技术第18-21页
    2.3 专业爬虫技术第21-26页
        2.3.1 专业搜索引擎中网络蜘蛛模型第21-23页
        2.3.2 目前主题网络蜘蛛所存在的问题第23-25页
        2.3.3 普通爬虫和主题爬虫对比第25-26页
    2.4 网页抽取技术第26-29页
        2.4.1 信息抽取技术概述第27页
        2.4.2 信息抽取技术的评价标准第27-29页
第三章 主题搜索引擎框架设计第29-56页
    3.1 信息采集模块第30-44页
        3.1.1 Robots.txt 和META 标签第31-35页
        3.1.2 链接过滤第35-36页
        3.1.3 主题网络蜘蛛的算法选择第36-44页
            3.1.3.1 主题网络蜘蛛的性能评价第36页
            3.1.3.2 主题网络蜘蛛算法第36-44页
        3.1.4 页面访问第44页
    3.2 主题词第44-46页
        3.2.1 主题词的选择及设置第44-46页
        3.2.2 根据主题词及其权值改变搜索顺序第46页
    3.3 权重网页和聚合网页第46-49页
        3.3.1 权重网页和聚合网页选择计算公式第48页
        3.3.2 权重网页和聚合网页的选择算法第48-49页
    3.4 查询模块第49-51页
        3.4.1 基于MVC 模式的查询子系统第50-51页
    3.5 详细设计与实现步骤第51-55页
    3.6 本章小结第55-56页
第四章 主题搜索引擎在电路课程中的应用第56-72页
    4.1 开放源代码Lucene第56-61页
        4.1.1 Lucene 简介第56-57页
        4.1.2 选用Lucene 的原因第57-58页
        4.1.3 Lucene 框架构成第58-61页
        4.1.4 Lucene 在本文中的应用第61页
    4.2 运行环境第61-62页
    4.3 Esearch 系统搭建第62-63页
    4.4 抓取系统(Spider)第63-68页
        4.4.1 网页抓取性能分析第66-68页
    4.5 搜索性能分析第68-69页
    4.6 Ajax 技术的使用第69-70页
    4.7 本章小结第70-72页
第五章 总结与展望第72-74页
参考文献第74-78页
附录1 Spider 起始判断模块第78-79页
附录2 Spider 分析页面处理代码模块第79-80页
附录3 Spider 下载线程代码模块第80-81页
附录4 建立索引模块代码第81-82页
致谢第82-83页
攻读硕士学位期间已录用的学术论文第83-86页
上海交通大学学位论文答辩决议书第86页

论文共86页,点击 下载论文
上一篇:超声图像滤波和数字减影血管造影运动伪影消除
下一篇:普适环境下基于推理的组合服务可靠性度量及验证