首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于本体进化的专题信息采集方法研究

摘要第4-5页
ABSTRACT第5页
第一章 绪论第11-17页
    1.1 研究背景及选题意义第11-12页
    1.2 国内外研究现状第12-15页
        1.2.1 专题信息采集技术国内外研究现状第12-14页
        1.2.2 本体进化技术国内外研究现状第14-15页
    1.3 本文的研究内容和技术路线第15-17页
        1.3.1 本文的研究内容第15页
        1.3.2 本文的技术路线第15-17页
第二章 相关基础理论研究第17-28页
    2.1 Web 信息采集理论第17-20页
        2.1.1 Web 信息采集技术的主要发展方向第17-19页
        2.1.2 Web 信息采集的基本原理第19页
        2.1.3 Web 信息采集器的基本结构第19-20页
    2.2 文本相似度计算理论第20-22页
        2.2.1 关键词提取第20-21页
        2.2.2 文档的向量表示第21-22页
    2.3 本体相关理论第22-26页
        2.3.1 本体概述第22-23页
        2.3.2 本体描述第23-24页
        2.3.3 本体开发第24-25页
        2.3.4 本体构建第25-26页
        2.3.5 本体进化第26页
    2.4 本章小结第26-28页
第三章 基于复杂信息源的专题信息采集方案设计第28-42页
    3.1 基于网络爬虫的信息采集第28-30页
        3.1.1 网络爬虫第28-29页
        3.1.2 爬行算法第29页
        3.1.3 信息采集第29-30页
    3.2 基于网页目标版块定向跟踪的信息采集第30-35页
        3.2.1 版块的定义第30-31页
        3.2.2 网页版块划分第31-32页
        3.2.3 版块位置记录第32-33页
        3.2.4 网页版块重定位第33-34页
        3.2.5 信息采集第34-35页
    3.3 基于 RSS 源的信息采集第35-39页
        3.3.1 RSS 源文件第35-37页
        3.3.2 RSS 内容解析第37-38页
        3.3.3 信息采集第38-39页
    3.4 基于复杂信息源的专题信息采集第39-41页
        3.4.1 网页专题相关性判定第39-40页
        3.4.2 专题信息采集方案第40-41页
    3.5 本章小结第41-42页
第四章 专题本体进化方案设计第42-56页
    4.1 专题网页内容提取第42-45页
        4.1.1 专题网页的一般结构第42页
        4.1.2 专题网页标题提取第42-43页
        4.1.3 专题网页正文提取第43-44页
        4.1.4 专题网页摘要提取第44-45页
        4.1.5 专题网页链接提取第45页
    4.2 专题网页内容预处理第45-48页
        4.2.1 专题网页的内容结构第45-47页
        4.2.2 专题网页内容的分词第47-48页
        4.2.3 专题网页特征词抽取第48页
    4.3 专题本体的进化第48-54页
        4.3.1 初始专题本体的构建第48-51页
        4.3.2 专题本体的进化算法第51-52页
        4.3.3 专题本体的进化方案第52-54页
    4.4 本章小结第54-56页
第五章 基于本体进化的专题信息采集系统的运行结果与分析第56-65页
    5.1 系统的主要功能结构及运行流程第56-57页
        5.1.1 系统的主要功能结构第56页
        5.1.2 系统的运行流程第56-57页
    5.2 基于本体进化的专题信息采集实验第57-64页
        5.2.1 专题网页采集实验第57-60页
        5.2.2 专题本体进化实验第60-64页
    5.3 本章小结第64-65页
第六章 总结与展望第65-67页
    6.1 总结第65页
    6.2 展望第65-67页
致谢第67-68页
参考文献第68-72页
攻读硕士期间发表的论文及科研成果第72页

论文共72页,点击 下载论文
上一篇:异步环境下的理性秘密分享方案
下一篇:基于Lucene的Discuz站内检索设计与实现