首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

面向主题的舆情采集搜索爬虫的设计与实现

摘要第1-9页
ABSTRACT第9-11页
第1章 绪论第11-22页
   ·背景分析第11-14页
   ·国内外研究现状第14-17页
     ·通用搜索引擎第14-15页
     ·面向主题的个性化搜索引擎第15-17页
   ·目前常见的搜索策略第17-20页
   ·本文的主要工作第20-21页
   ·本文的组织结构第21-22页
第2章 需求分析第22-37页
   ·主题分析法及其特征第22-23页
   ·主题分析法在网络的应用第23-24页
   ·主题分析法与网络舆情信息分析的结合第24-26页
   ·面向舆情主题搜索爬虫存在的问题第26-27页
   ·Boltzmann行动选择策略第27-30页
     ·模拟退火算法第27-29页
     ·基于模拟退火的Boltzmann行动选择策略第29-30页
   ·基于信噪比的网页权重第30-33页
     ·信噪比的概念第30-31页
     ·网页信噪比第31-33页
   ·在线增量自学习的聚焦爬行第33-34页
     ·在线增量自学习的意义第33页
     ·自学习模型的建立第33-34页
   ·网络舆情信息主题分析的工作框架第34-37页
第3章 概要设计第37-49页
   ·系统设计目标第37-38页
   ·系统设计架构第38-40页
   ·主题模块的设计第40-41页
   ·Boltzmann概率计算器第41-43页
   ·链接数据库第43页
   ·网页抓取控制器第43页
   ·HTML结构分析器第43-44页
   ·链接优先权队列第44-45页
   ·网页信噪比比较器第45-46页
   ·置信窗口第46页
   ·在线增量更新器第46页
   ·Robot协议分析器第46-49页
第4章 系统详细设计第49-62页
   ·面向主题的舆情采集爬虫设计目标第49页
   ·设计原则第49-50页
   ·部分类图设计第50-51页
     ·基于工厂模式的爬行器第50-51页
     ·基于观察者模式的增量更新器第51页
   ·网络架构第51-52页
   ·数据库设计第52-59页
   ·系统技术结构第59-62页
第5章 系统实现与测试第62-85页
   ·Q价值计算的实现第62-65页
   ·网页信噪比计算的实现第65-66页
   ·Boltzmann的算法的实现第66-72页
   ·Robot协议分析器的实现第72-75页
   ·初始种子模块第75-76页
   ·实验测试标准第76-77页
   ·实验结果第77-79页
   ·系统功能实现第79-85页
第6章 总结与展望第85-86页
参考文献第86-87页
致谢第87-88页
学位论文评阅及答辩情况表第88页

论文共88页,点击 下载论文
上一篇:农村社会保险管理信息系统的设计与实现
下一篇:面向领域的Web数据集成中数据抽取的研究