中文摘要 | 第1-7页 |
ABSTRACT | 第7-8页 |
序 | 第8-11页 |
1 引言 | 第11-14页 |
·系统的产生背景及现实意义 | 第11-12页 |
·高校 BBS 的特点 | 第11页 |
·舆论导向的重要性 | 第11-12页 |
·系统重要性 | 第12页 |
·论文的工作和整体结构 | 第12-14页 |
·系统的整体设计 | 第12-13页 |
·论文整体结构 | 第13-14页 |
2 网络爬虫综述 | 第14-27页 |
·网络爬虫的产生和发展 | 第14-15页 |
·网络爬虫的热点技术 | 第15-27页 |
·聚焦爬虫的工作原理和关键技术 | 第15-18页 |
·个性化智能爬虫 | 第18-21页 |
·分布式网络爬虫 | 第21-24页 |
·网络爬虫算法 | 第24-27页 |
3 主题网络爬虫介绍 | 第27-33页 |
·主题网络爬虫的产生背景和发展现状 | 第27页 |
·主题网络爬虫的功能模块介绍 | 第27-33页 |
·系统介绍 | 第28页 |
·主题确立模块 | 第28-29页 |
·优化初始种子模块 | 第29页 |
·主题相关度分析模块 | 第29-30页 |
·队列管理模块 | 第30-31页 |
·排序模块 | 第31-33页 |
4 开发平台简介 | 第33-42页 |
·开发平台简介 | 第33页 |
·Microsoft Visual Studio 介绍 | 第33-35页 |
·Visual Studio 简介 | 第33-34页 |
·C#介绍 | 第34-35页 |
·Oracle 9i 介绍 | 第35-37页 |
·Oracle 9i 基本特点 | 第35-37页 |
·Oracle存储结构 | 第37页 |
·Regulator 软件介绍 | 第37-39页 |
·正则表达式匹配技术 | 第37-38页 |
·Regulator 软件介绍 | 第38-39页 |
·自行开发的HTML页面处理工具 | 第39页 |
·关键技术 | 第39-42页 |
·MD5介绍 | 第39-40页 |
·多线程技术 | 第40-42页 |
5 高校 BBS 网络爬虫及热点分析系统的设计和实现 | 第42-58页 |
·产生背景 | 第42页 |
·BBS 网络爬虫模块的设计和实现 | 第42-54页 |
·系统目标 | 第42页 |
·获取数据分类 | 第42-44页 |
·数据库表设计 | 第44-46页 |
·功能模块设计 | 第46-47页 |
·系统重要参数 | 第47-48页 |
·数据采集流程 | 第48-54页 |
·热点分析系统的设计和实现 | 第54-58页 |
6 结论和展望 | 第58-60页 |
·结论 | 第58页 |
·展望 | 第58-60页 |
·搜索功能 | 第58-59页 |
·模型抽取 | 第59页 |
·热点分析的多元化 | 第59-60页 |
参考文献 | 第60-61页 |
作者简历 | 第61-63页 |
学位论文数据集 | 第63页 |