WEB主题信息搜集技术研究

摘要	第1-3页
ABSTRACT	第3-6页
第一章绪论	第6-12页
·研究背景	第6-10页
·搜索引擎	第6-7页
·Web 主题信息搜集的研究意义	第7-9页
·Web 主题信息搜集研究现状	第9-10页
·论文研究内容及组织	第10-12页
第二章 WEB 主题信息搜集技术	第12-22页
·搜集主题的表示	第12-13页
·种子URL 的确定	第13页
·待访URL 的选取	第13-15页
·网页下载	第15-17页
·网页下载常用协议	第16-17页
·网页下载	第17页
·网页解析	第17-19页
·HTML 文件标签树	第17-19页
·网页正文抽取	第19页
·WEB 重访	第19-20页
·并行分布式搜集	第20-21页
·本章小节	第21-22页
第三章基于带权语言网络的网页关键词抽取	第22-29页
·复杂网络及复杂网络的中心度	第22-25页
·复杂网络	第22-23页
·复杂网络的中心度	第23-25页
·带权语言网络	第25-27页
·语言网络	第25页
·语言网络的权	第25-27页
·基于带权语言网络的网页关键词抽取	第27-28页
·带权语言网络的词语权重度量	第27页
·基于带权语言网络的关键词抽取算法	第27-28页
·本章小节	第28-29页
第四章 WEB 主题信息搜集策略	第29-40页
·WEB 主题信息搜集问题	第29-31页
·搜索及启发式搜索	第29-30页
·Web 主题信息搜集形式化描述及算法	第30-31页
·WEB 主题信息搜集中的领域知识	第31-33页
·超链接建立目的	第31页
·Web 主题信息分布规律	第31-33页
·URL 价值测度	第33-37页
·网页的主题相关性计算	第33-35页
·URL 价值测度	第35-37页
·提高信息召回率的措施	第37-39页
·本章小节	第39-40页
第五章实验及结果分析	第40-50页
·实验平台	第40-42页
·网页关键词抽取实验及结果分析	第42-44页
·WEB 主题信息搜集策略实验及结果分析	第44-49页
·Web 主题信息搜集性能度量指标	第44-45页
·启发式搜索中不同URL 价值测度方法的搜集性能比较	第45-48页
·两种主题信息搜集策略的召回率比较	第48-49页
·本章小节	第49-50页
第六章总结与展望	第50-52页
·论文所做的主要工作	第50页
·展望	第50-52页
参考文献	第52-55页
致谢	第55-56页
附录A 论文部分源代码	第56-67页
作者简介及在校期间发表论文	第67页