首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向网络舆情分析的Web数据源获取关键技术研究

摘要第1-4页
Abstract第4-7页
1 绪论第7-13页
   ·研究背景及意义第7-8页
   ·国内外研究现状第8-10页
   ·本论文主要工作与研究内容第10页
   ·本论文内容及组织结构第10-13页
2 Web数据源获取关键技术综述第13-23页
   ·网络爬虫技术介绍第13-17页
     ·爬虫工作原理第13-14页
     ·搜索策略第14-16页
     ·漫游空间第16-17页
   ·Web信息抽取技术介绍第17-22页
     ·基于自然语言处理的抽取技术第17-18页
     ·基于包装器归纳学习的抽取技术第18-19页
     ·基于Ontology的抽取技术第19-20页
     ·基于模板的抽取技术第20页
     ·基于DOM Tree结构的抽取技术第20-22页
   ·本章小结第22-23页
3 面向网络舆情分析的Web爬虫设计第23-33页
   ·面向网络舆情分析Web爬虫的特点第23页
   ·面向论坛的爬虫设计第23-28页
   ·面向博客的爬虫设计第28-31页
   ·本章小结第31-33页
4 针对列表式页面的Web信息自动提取与分类技术第33-49页
   ·技术概述第33-35页
   ·页面预处理第35-36页
   ·有效数据记录集抽取第36-42页
     ·数据记录集的抽取第37-41页
     ·有效数据记录集的判定第41-42页
   ·详细信息的提取第42-44页
   ·详细信息的分类第44-47页
   ·本章小结第47-49页
5. 实验及数据分析第49-57页
   ·面向舆情分析的Web爬虫第49-51页
     ·Web爬虫运行环境及界面第49页
     ·数据爬行结果第49-51页
   ·Web信息抽取和分类第51-55页
     ·测试环境、数据源及性能指标第51-52页
     ·有效数据记录集的提取第52-53页
     ·详细信息的抽取第53-54页
     ·详细信息的分类第54-55页
   ·本章小结第55-57页
6. 总结第57-59页
   ·主要研究成果第57页
   ·进一步的讨论与展望第57-59页
致谢第59-61页
参考文献第61-64页

论文共64页,点击 下载论文
上一篇:基于多核环境的并行下载系统研究开发
下一篇:分色方法的建模研究与误差分析