首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向主题搜索引擎的若干关键技术的研究

摘要第4-5页
Abstract第5页
第一章 绪论第13-17页
    1.1 研究的背景及意义第13-14页
    1.2 国内外的研究现状第14页
    1.3 面向主题搜索引擎简介第14-15页
    1.4 面向主题搜索引擎发展前景第15页
        1.4.1 就其行业发展趋势来说第15页
        1.4.2 就其社会需求来说第15页
        1.4.3 就其市场契机来讲第15页
    1.5 本章小结第15-17页
第二章 基于Lucene引擎相关技术介绍第17-29页
    2.1 Lucene框架第17-21页
        2.1.1 全文检索第17-18页
        2.1.2 Lucene项目简介及其框架构成第18-20页
        2.1.3 Lucene全文和数据库索引比较第20-21页
    2.2 文档索引机制第21-23页
        2.2.1 索引技术第21-22页
        2.2.2 建立Lucene索引的过程第22页
        2.2.3 索引的合并、优化及同步第22-23页
    2.3 搜索机制第23-25页
        2.3.1 搜索的实现第23-24页
        2.3.2 文档评分与结果排序第24页
        2.3.3 Lucene的分析器第24-25页
    2.4 分词的具体机制第25-27页
        2.4.1 一般运用的分词计算方法第26-27页
        2.4.2 Lucene分词的实现第27页
        2.4.3 本文采用的分词第27页
    2.5 本章小结第27-29页
第三章 面向主题搜索引擎相关的关键性技术第29-45页
    3.1 面向主题网络爬虫的技术性研究第29-30页
        3.1.1 网络爬虫关键性技术概述以及工作理论第29-30页
        3.1.2 主题爬虫结构模型第30页
    3.2 主题页面在Web上的分布特征第30-31页
    3.3 主题爬虫采用的搜索计策第31-37页
        3.3.1 信息判断的搜索策略第32页
        3.3.2 链接判断的搜索策略第32-35页
        3.3.3 改进的HITS算法第35-37页
        3.3.4 信息链接融合的搜索策略第37页
    3.4 主题相关度第37-41页
        3.4.1 布尔模型第37-38页
        3.4.2 空间向量模型第38-39页
        3.4.3 改进的VSM模型第39-41页
    3.5 结构化信息提取技术第41-44页
        3.5.1 评测标准第41-42页
        3.5.2 规则抽取技术第42-43页
        3.5.3 关键的提取技术研究第43-44页
    3.6 本章小结第44-45页
第四章 程序系统的解析与实现第45-57页
    4.1 体系原型结构实现第45-46页
    4.2 网络蜘蛛的实现第46-48页
    4.3 基于Lucene的索引模块探索第48-50页
        4.3.1 探索索引结构第48-49页
        4.3.2 中文分词第49-50页
    4.4 用户接口模块的实现第50-52页
        4.4.1 MVC模式的介绍第50-51页
        4.4.2 检索子系统的MVC模式规划与实现第51-52页
    4.5 多线程的相关技术运用第52-53页
    4.6 网页消重策略第53页
    4.7 改进性能的实验分析第53-55页
        4.7.1 实验工具及环境第53-54页
        4.7.2 优化性能测试分析第54-55页
    4.8 本章小结第55-57页
第五章 结论第57-59页
    5.1 论文总结第57页
    5.2 研究展望第57-59页
参考文献第59-63页
作者简介第63页
作者在攻读硕士学位期间发表的学术论文第63-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:纳米药物载体的体内输送过程及其靶向/脱靶作用研究
下一篇:静电纺丝法制备荷正电陶瓷微滤膜及其吸附分离性能研究