首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向房产信息本体的主题爬虫算法研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-17页
    1.1 课题背景第11-12页
    1.2 研究意义第12页
    1.3 主题爬虫国内外研究现状第12-15页
    1.4 本文的主要工作第15-16页
    1.5 本章小结第16-17页
第二章 相关理论及研究现状第17-26页
    2.1 主题爬虫相关理论第17-20页
        2.1.1 主题爬虫原理第17页
        2.1.2 主题爬虫结构第17-18页
        2.1.3 主题模型理论第18-20页
    2.2 本体相关理论第20-22页
        2.2.1 本体的概念第21-22页
        2.2.2 本体的构建第22页
    2.3 其它相关理论第22-25页
        2.3.1 BP神经网络第22-24页
        2.3.2 人工鱼群算法第24-25页
    2.4 本章小节第25-26页
第三章 基于内容学习的本体自适应算法研究第26-38页
    3.1 网页内容信息提取第26-29页
        3.1.1 网页内容处理流程分析第26-27页
        3.1.2 基于剪枝技术的信息抽取算法第27-29页
    3.2 本体概念相似度计算模型第29-31页
        3.2.1 概念距离相似度第29-30页
        3.2.2 节点深度相似度第30-31页
        3.2.3 语义重合度第31页
    3.3 基于内容学习的本体自适应的算法第31-37页
        3.3.1 本体自适应模型设计第31-33页
        3.3.2 本体概念规范第33-34页
        3.3.3 本体自适应算法第34-37页
    3.4 本章小节第37-38页
第四章 基于BFA的主题爬虫相关度算法研究第38-48页
    4.1 基于本体文本内容解析第38-40页
        4.1.1 词集概念化第38-39页
        4.1.2 文本内容向量化第39-40页
    4.2 基于权值因子的人工鱼群算法改进第40-42页
    4.3 基于BFA主题相关度算法研究第42-46页
        4.3.1 人工鱼编码设计第42-43页
        4.3.2 基于BFA算法优化流程第43-46页
    4.4 实验分析第46-47页
        4.4.1 实验相关设计第46-47页
        4.4.2 评价指标第47页
        4.4.3 实验结果分析第47页
    4.5 本章小节第47-48页
第五章 面向房产信息本体的主题爬虫系统实现第48-68页
    5.1 主题爬虫系统结构设计第48-49页
    5.2 网页下载模块实现第49-55页
        5.2.1 网页下载模块结构设计第49-50页
        5.2.2 网页下载模块详细实现第50-55页
    5.3 本体自适应模块第55-58页
        5.3.1 房产信息本体构建第55-56页
        5.3.2 本体自适应模块设计第56-58页
    5.4 BFA主题计算模块第58-62页
        5.4.1 BFA算法训练集创建第58-60页
        5.4.2 BFA模型训练第60-62页
    5.5 系统功能分析第62-64页
    5.6 系统性能分析第64-67页
        5.6.1 对比组设计第64-65页
        5.6.2 评价指标第65页
        5.6.3 实验结果分析第65-67页
    5.7 本章小节第67-68页
第六章 总结与展望第68-70页
    6.1 本文工作总结第68-69页
    6.2 未来展望第69-70页
致谢第70-71页
参考文献第71-75页
附录第75-76页
详细摘要第76-78页

论文共78页,点击 下载论文
上一篇:基于Hadoop的面向海量交通流数据分析与利用
下一篇:基于协作相容性的工作流任务分配优化方法