Web端新闻自动采集系统的设计与实现

摘要	第5-7页
Abstract	第7-8页
第一章绪论	第11-19页
1.1 研究背景与意义	第11页
1.2 本课题的研究进展	第11-17页
1.2.1 新闻自动采集系统应用现状	第12-13页
1.2.2 网络爬虫研究现状	第13-15页
1.2.3 文本分类研究现状	第15-17页
1.3 本文主要研究内容	第17-19页
第二章系统相关技术研究	第19-31页
2.1 网页爬取技术	第19-25页
2.1.1 网络爬虫组成部分与爬行策略	第19-20页
2.1.2 Heritrix中的爬虫	第20-24页
2.1.3 html解析	第24-25页
2.2 文本分类技术	第25-26页
2.2.1 文本分类的特点	第25页
2.2.2 分词技术	第25-26页
2.2.3 特征选择与特征抽取	第26页
2.3 jQuery技术	第26-30页
2.3.1 B/S模式下Web页面技术	第26-28页
2.3.2 jQuery主要特点介绍	第28页
2.3.3 jQuery组成结构	第28-29页
2.3.4 jQuery运行原理	第29-30页
2.4 本章小结	第30-31页
第三章新闻自动采集系统的需求分析以及整体架构	第31-41页
3.1 新闻自动采集系统的需求分析	第31-32页
3.1.1 功能需求	第31-32页
3.1.2 性能指标	第32页
3.2 新闻自动采集系统的整体设计	第32-39页
3.2.1 设计原则	第32页
3.2.2 系统结构与工作原理	第32-35页
3.2.3 系统模块	第35-39页
3.3 部署环境设计	第39-40页
3.4 本章小结	第40-41页
第四章新闻自动采集系统的详细设计与实现	第41-55页
4.1 新闻采集部分的详细设计与实现	第41-44页
4.2 文本处理部分的详细设计与实现	第44-47页
4.2.1 文本处理部分设计需求	第44页
4.2.2 文本处理模块设计方案	第44-45页
4.2.3 文本处理模块具体实现	第45-47页
4.3 应用层的设计与实现	第47-51页
4.3.1 应用层的设计要求	第47页
4.3.2 应用层的设计方案	第47-48页
4.3.3 应用层的具体实现	第48-51页
4.4 关系数据库的设计与实现	第51-54页
4.5 本章小结	第54-55页
第五章系统的测试与分析	第55-63页
5.1 系统的运行环境	第55-57页
5.2 系统功能测试	第57-59页
5.3 系统性能检测和分析	第59-61页
5.3.1 系统整体性能测试	第59-60页
5.3.2 新闻采集与存储性能测试	第60-61页
5.4 本章小结	第61-63页
第六章结论与展望	第63-65页
6.1 论文工作归纳	第63-64页
6.2 未来工作设想	第64-65页
参考文献	第65-67页
致谢	第67-69页
个人简历、在学期间发表的论文与研究成果	第69页