首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向人物简介的主题爬虫设计与实现

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-16页
   ·研究背景及意义第10-11页
   ·国内外研究现状第11-15页
     ·基于关键字的爬行策略第11-12页
     ·基于链接分析的爬行策略第12-14页
     ·基于分类器预测的爬行策略第14-15页
   ·本文的组织与结构第15-16页
第2章 相关技术概述第16-33页
   ·主题爬虫相关技术第16-22页
     ·网络爬虫技术概述第16-19页
     ·网络爬虫实例第19-22页
   ·文本分类相关技术第22-33页
     ·预处理第23-24页
     ·文本表示第24-25页
     ·特征选取第25-28页
     ·文本分类算法第28-33页
第3章 基于数据集自动获取的 KNN 分类器实现及优化第33-43页
   ·初始数据集自动获取第33-34页
   ·基于 LDA 主题模型的数据集自动扩充第34-38页
     ·LDA 模型算法原理第34-35页
     ·Gibbs 抽样算法第35-36页
     ·基于 LDA 模型的文本生成第36-38页
   ·基于数据集自动获取的 KNN 分类器的设计第38-41页
     ·KNN 简介第38-39页
     ·基于数据集自动获取的 KNN 分类器第39-41页
   ·实验及结果分析第41-42页
   ·本章小结第42-43页
第4章 面向人物简介的主题爬虫设计与实现第43-66页
   ·面向人物简介的主题爬虫系统总体设计第43-45页
     ·系统目标第43页
     ·系统需求分析第43-44页
     ·系统构架第44-45页
   ·面向人物简介的主题爬虫系统功能模块设计第45-58页
     ·系统用例设计第46-48页
     ·网页爬行模块第48-52页
     ·基于 LDA 主题模型的数据集自动生成模块第52-56页
     ·基于 KNN 分类器的网页识别模块第56-58页
   ·面向人物简介的主题爬虫系统的实现第58-65页
     ·系统的开发环境第59页
     ·系统的算法结构第59-61页
     ·系统的测试与运行第61-63页
     ·系统的测试效果分析第63-65页
   ·本章小结第65-66页
第5章 总结与展望第66-68页
   ·工作总结第66页
   ·研究展望第66-68页
参考文献第68-70页
作者简介第70-71页
致谢第71页

论文共71页,点击 下载论文
上一篇:基于多维矢量矩阵的最优变换的研究
下一篇:高职院校计算机基础课程网络教学平台研究与设计