首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于主题的数据API检索平台关键技术的研究与实现

摘要第4-5页
Abstract第5页
第1章 绪论第12-16页
    1.1 课题背景及意义第12-13页
    1.2 课题目标第13-14页
    1.3 本文贡献和创新点第14页
    1.4 本文组织结构第14-15页
    1.5 本章小结第15-16页
第2章 相关技术调研第16-27页
    2.1 爬虫技术第16-19页
        2.1.1 PySpider爬虫框架第16-17页
        2.1.2 Scrapy爬虫框架第17-19页
    2.2 消息队列第19-22页
        2.2.1 特点介绍第20-21页
        2.2.2 消息队列种类第21-22页
    2.3 全文检索第22-24页
    2.4 主题模型第24-26页
    2.5 本章小结第26-27页
第3章 平台总体架构设计概述第27-36页
    3.1 总体需求第27-29页
    3.2 平台的总体架构第29-32页
        3.2.1 用户请求与操作第30页
        3.2.2 数据接口中间层第30-31页
        3.2.3 数据处理与执行层第31-32页
    3.3 系统总体流程第32-35页
        3.3.1 数据采集子系统第33-34页
        3.3.2 基于主题的数据分类和检索子系统第34-35页
    3.4 本章小结第35-36页
第4章 数据采集子系统的设计与实现第36-49页
    4.1 概述第36-37页
    4.2 总体设计第37-39页
    4.3 基于模板的网页信息提取第39-46页
        4.3.1 网页文档的预处理第40-43页
        4.3.2 基于结构相似度的网页文档聚类第43-45页
        4.3.3 模板生成和基于模板的内容提取第45-46页
    4.4 网页抓取的设计第46-47页
    4.5 分布式的数据存储设计第47-48页
    4.6 本章小结第48-49页
第5章 基于主题的数据分类和检索第49-62页
    5.1 概述第49页
    5.2 总体设计第49-51页
    5.3 基于主题模型的API主题的选取设计第51-57页
        5.3.1 基于LDA的主题模型第51-57页
    5.4 基于API主题的检索第57-61页
        5.4.1 API主题索引的创建第57-59页
        5.4.2 基于相似度的API主题的检索第59-61页
    5.5 本章小结第61-62页
第6章 实验结果与分析第62-76页
    6.1 实验环境第62页
        6.1.1 运行环境第62页
    6.2 实验结果及分析第62-75页
        6.2.1 网页数据抓取效果及分析第62-64页
        6.2.2 抽取模板和网页抽取效果分析第64-67页
        6.2.3 LDA主题模型建模及分析第67-71页
        6.2.4 基于API主题的检索效果分析第71-75页
    6.3 本章小结第75-76页
第7章 总结和展望第76-78页
    7.1 本文总结第76-77页
    7.2 下一步工作和未来展望第77-78页
参考文献第78-81页
致谢第81页

论文共81页,点击 下载论文
上一篇:肺部轮廓畸变辅助诊断算法的设计与实现
下一篇:基于智能手机的车辆检测与车距测量