摘要 | 第6-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第11-16页 |
1.1 课题背景及研究意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-13页 |
1.2.1 互联网主流汽车站点现状研究 | 第12页 |
1.2.2 主题网络爬虫研究现状 | 第12-13页 |
1.3 研究内容及组织结构 | 第13-15页 |
1.3.1 论文主要研究内容 | 第13-14页 |
1.3.2 论文组织结构 | 第14-15页 |
1.4 小结 | 第15-16页 |
第2章 汽车产业链协同服务平台用户对行业信息的需求分析 | 第16-22页 |
2.1 汽车产业链协同平台用户对信息种类的需求分析 | 第16-18页 |
2.1.1 汽车行业政策法规类信息需求分析 | 第16-17页 |
2.1.2 汽车行业新闻类信息需求分析 | 第17-18页 |
2.1.3 汽车零部件价格类数据需求分析 | 第18页 |
2.2 平台中小型汽车企业获取互联网行业信息存在的问题 | 第18-19页 |
2.3 系统功能需求分析 | 第19-21页 |
2.4 小结 | 第21-22页 |
第3章 基于主题网络爬虫的汽车行业多元信息Web系统总体设计 | 第22-31页 |
3.1 汽车行业多元信息web系统设计目标 | 第22页 |
3.2 汽车行业多元信息web系统总体架构 | 第22-23页 |
3.3 汽车行业多元信息web系统总体功能设计 | 第23-26页 |
3.3.1 用户功能模块设计 | 第24-25页 |
3.3.2 管理员功能模块设计 | 第25-26页 |
3.4 数据库设计方案 | 第26-29页 |
3.4.1 E-R图设计 | 第26-27页 |
3.4.2 主要数据表格的设计 | 第27-29页 |
3.5 主题网络爬虫设计方案 | 第29-30页 |
3.6 小结 | 第30-31页 |
第4章 基于主题爬虫的汽车行业多元信息Web系统的关键技术的研究 | 第31-48页 |
4.1 主题网络爬虫工作原理 | 第31-34页 |
4.2 主题网络爬虫结构 | 第34-35页 |
4.3 网页解析 | 第35-37页 |
4.3.1 HTMLParser解析器 | 第35-36页 |
4.3.2 解析标签确立 | 第36-37页 |
4.4 特征词提取 | 第37-38页 |
4.5 主题基准模型 | 第38-42页 |
4.5.1 主流主题基准模型 | 第38-39页 |
4.5.2 本文主题基准模型方案 | 第39-40页 |
4.5.3 本文主题词库的建立 | 第40-41页 |
4.5.4 主题特征赋值 | 第41-42页 |
4.6 搜索策略 | 第42-47页 |
4.6.1 主流搜索策略的研究 | 第42-45页 |
4.6.2 本文搜索策略方案 | 第45-47页 |
4.7 小结 | 第47-48页 |
第5章 基于主题网络爬虫的汽车行业多元信息web系统的实现 | 第48-62页 |
5.1 系统开发环境 | 第48页 |
5.2 系统功能实现 | 第48-61页 |
5.2.1 种子站点初始化 | 第48-50页 |
5.2.2 网页下载模块的实现 | 第50-51页 |
5.2.3 网页信息抽取模块的实现 | 第51-52页 |
5.2.4 主题相关性判别模块的实现 | 第52-53页 |
5.2.5 链接控制块的实现 | 第53-57页 |
5.2.6 用户界面的实现 | 第57-58页 |
5.2.7 留言评论功能的实现 | 第58页 |
5.2.8 信息查询功能的实现 | 第58-59页 |
5.2.9 系统管理功能的实现 | 第59-61页 |
5.3 小结 | 第61-62页 |
总结与展望 | 第62-64页 |
论文总结工作 | 第62页 |
后续工作展望 | 第62-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-68页 |