首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

个性化垂直搜索引擎的研究与实现

摘要第4-5页
abstract第5页
缩略词第10-11页
第一章 绪论第11-15页
    1.1 研究背景和意义第11-12页
    1.2 国内外的研究现状第12-13页
    1.3 研究内容以及主要工作第13-14页
        1.3.1 主题网络爬虫技术的研究第13页
        1.3.2 网页结构化信息抽取技术的研究第13-14页
        1.3.3 搭建垂直搜索引擎的系统框架并实现专家机器人系统第14页
    1.4 本文的内容安排第14-15页
第二章 垂直搜索引擎的相关理论及其关键技术第15-22页
    2.1 垂直搜索引擎第15-17页
        2.1.1 垂直搜索引擎与通用搜索引擎的区别第15-16页
        2.1.2 垂直搜索引擎的原理第16-17页
    2.2 主题网络爬虫的相关技术第17-18页
    2.3 网页结构化信息抽取技术第18-19页
    2.4 基于支持向量机SVM的分类算法第19-20页
    2.5 开源框架LUCENE第20页
    2.6 系统质量的评测标准第20页
    2.7 本章小结第20-22页
第三章 主题网络爬虫技术的研究第22-38页
    3.1 引言第22页
    3.2 主题网络爬虫的系统框架第22-23页
    3.3 基于链接上下文信息的主题描述算法的研究第23-26页
        3.3.1 相关概念与分析第24-25页
        3.3.2 CTKW向量和TD向量的表示第25页
        3.3.3 对CTKW向量进行去噪第25-26页
        3.3.4 计算CTKW向量和TD向量的权重第26页
    3.4 基于SVM分类模型的主题相关性算法的研究第26-30页
        3.4.1 文本相似度计算方法第27页
        3.4.2 主题相关性算法的研究第27-30页
    3.5 基于SVM分类模型的主题爬虫算法的研究第30-37页
        3.5.1 爬虫算法的设计第30-33页
            3.5.1.1 FG算法的设计第30-31页
            3.5.1.2 主题分类第31-32页
            3.5.1.3 AG算法的设计第32-33页
        3.5.2 主题爬虫的抓取流程第33页
        3.5.3 实验与分析第33-37页
            3.5.3.1 实验评定指标第33-35页
            3.5.3.2 实验结果分析第35-37页
    3.6 本章小结第37-38页
第四章 网页结构化信息抽取技术的研究第38-49页
    4.1 引言第38页
    4.2 相关概念和技术分析第38-41页
        4.2.1 具体概念的定义第38-39页
        4.2.2 页面结构的特性分析第39-40页
        4.2.3 主题属性页面的标签表示的特征分析第40页
        4.2.4 主题属性页面的属性表示的特征分析第40-41页
    4.3 基于WEB标签序列的网页结构化主题信息的抽取技术第41-45页
        4.3.1 处理标签的策略第41页
        4.3.2 相关定义第41-43页
        4.3.3 基于Web标签序列的网页结构化主题信息抽取模型第43-44页
        4.3.4 进行样本训练的模块第44-45页
        4.3.5 抽取主题信息的子模块第45页
    4.4 实验结果分析第45-48页
        4.4.1 实验过程第45-47页
        4.4.2 实验分析第47-48页
    4.5 本章小结第48-49页
第五章 专家机器人垂直搜索引擎的搭建及实现第49-60页
    5.1 引言第49页
    5.2 系统分析第49-50页
    5.3 各子系统的设计与实现第50-56页
        5.3.1 主题网络爬虫模块的研究和设计第50页
        5.3.2 网页结构化信息抽取模块的研究和设计第50页
        5.3.3 网页排序模块的研究和设计第50-54页
        5.3.4 网页去重模块的研究和设计第54-55页
        5.3.5 数据存储和缓存系统的研究和设计第55-56页
        5.3.6 信息索引和检索模块第56页
    5.4 实验结果第56-59页
    5.5 本章小结第59-60页
第六章 总结与展望第60-62页
    6.1 工作总结第60页
    6.2 未来展望第60-62页
参考文献第62-66页
致谢第66-67页
在学期间的研究成果及发表的学术论文第67页

论文共67页,点击 下载论文
上一篇:云计算环境下可验证的可搜索加密研究
下一篇:变尺度对象追踪技术及应用研究