基于网络爬虫的内容资源评价研究

摘要	第5-6页
abstract	第6页
第1章绪论	第9-16页
1.1 研究背景和意义	第9-10页
1.2 国内外研究现状及发展趋势	第10-14页
1.2.1 内容资源评价	第10-11页
1.2.2 网络爬虫	第11-12页
1.2.3 关键词提取技术	第12-13页
1.2.4 文本倾向性分析	第13-14页
1.3 论文主要研究内容	第14-15页
1.4 论文章节安排	第15-16页
第2章系统设计与主要技术概述	第16-25页
2.1 内容资源评价系统设计	第16-19页
2.1.1 内容资源评价系统模块设计	第16-17页
2.1.2 内容资源评价系统流程设计	第17-19页
2.2 网络爬虫主要技术概述	第19-20页
2.2.1 网络爬虫的基本概念与原理	第19页
2.2.2 网络爬虫分类	第19-20页
2.3 文本分析概述	第20-22页
2.3.1 文本关键词提取	第20-21页
2.3.2 文本倾向性分析	第21-22页
2.4 数据存储概述	第22-24页
2.4.1 数据存储NoSQL	第22-23页
2.4.2 Mongodb介绍	第23-24页
2.5 本章小结	第24-25页
第3章网络爬虫的设计与研究	第25-40页
3.1 设计目标	第25页
3.2 基于SCRAPY的“通用”爬虫框架设计	第25-28页
3.2.1 Scrapy爬虫框架	第25-26页
3.2.2“通用”定向爬虫流程设计	第26-27页
3.2.3“通用”定向爬虫模块设计	第27-28页
3.3 基于SCRAPY的“通用”爬虫实现	第28-34页
3.3.1“通用”定向爬虫配置文件设计	第28-31页
3.3.2“通用”定向爬虫Scrapy框架配置	第31-32页
3.3.3 基于Scrapy框架的爬虫功能实现	第32-34页
3.4 基于代理的移动端数据抓取	第34-37页
3.4.1 基于移动代理的移动数据抓取设计	第34-35页
3.4.2 基于移动代理的移动数据抓取实现	第35-37页
3.5 实验结果与分析	第37-39页
3.6 本章小结	第39-40页
第4章文本内容分析	第40-49页
4.1 实现目标	第40页
4.2 关键词提取技术	第40-43页
4.2.1 TF-IDF关键词提取算法研究	第40-41页
4.2.2 TextRank关键词提取算法研究	第41-42页
4.2.3 基于Jieba的关键词提取	第42-43页
4.3 文本倾向性分析	第43-46页
4.3.1 朴素贝叶斯文本分类器	第43-45页
4.3.2 基于SnowNLP的文本分类	第45-46页
4.4 实验结果与分析	第46-48页
4.4.1 关键词抽取	第46-47页
4.4.2 文本倾向性判定	第47-48页
4.5 本章小结	第48-49页
第5章系统整合部署	第49-55页
5.1 内容资源评价系统功能	第49-50页
5.2 内容资源评价系统部署	第50-51页
5.3 系统运行结果及分析	第51-53页
5.4 本章小结	第53-55页
结论	第55-56页
参考文献	第56-60页
攻读学位期间发表论文与研究成果清单	第60-61页
致谢	第61页