智能信息采集搜索策略研究

摘要	第1-8页
Abstract	第8-10页
插图索引	第10-11页
第1章绪论	第11-22页
·研究背景	第11-12页
·研究进展	第12-20页
·Web信息采集中的关键问题	第12-13页
·Web采集技术的发展及现状	第13-14页
·基于主题的网络蜘蛛搜索策略研究	第14-20页
·本文所做工作	第20-22页
第2章基于综合价值的网络蜘蛛搜索策略	第22-30页
·引言	第22页
·链接的立即价值和综合价值	第22-25页
·基于综合价值的网络蜘蛛搜索策略	第25-27页
·Web资源分布与链接价值关系的分析	第25-26页
·基于综合价值的网络蜘蛛搜索策略	第26-27页
·实验	第27-29页
·实验方法	第27-28页
·实验结果	第28-29页
·小结	第29-30页
第3章基于主题分块的PageRank算法	第30-36页
·引言	第30-31页
·PageRank算法	第31页
·结合文本内容的PageRank算法	第31-32页
·基于主题分块的PageRank算法	第32-34页
·实验	第34-35页
·结论	第35-36页
第4章基于遗传算法的web信息搜集策略研究	第36-44页
·引言	第36-37页
·Web信息在网络蜘蛛中的作用	第37页
·遗传算法的概况	第37-40页
·基于遗传算法的网络蜘蛛搜索策略	第40-42页
·编码方法	第40页
·适应度函数	第40-41页
·初始化种群	第41页
·杂交算子	第41页
·变异算子	第41页
·算法描述	第41-42页
·实验	第42-43页
·结论	第43-44页
第5章基于多种搜索策略的网络蜘蛛原型系统	第44-48页
·系统设计	第44-45页
·关键问题的处理	第45页
·链接价值的计算	第45页
·Html文档DOM树的生成	第45页
·主要功能的实现	第45-47页
·小结	第47-48页
结论	第48-49页
参考文献	第49-53页
致谢	第53-54页
附录A 攻读学位期间完成的论文	第54页