首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

WEB主题信息搜集技术研究

摘要第1-3页
ABSTRACT第3-6页
第一章 绪论第6-12页
   ·研究背景第6-10页
     ·搜索引擎第6-7页
     ·Web 主题信息搜集的研究意义第7-9页
     ·Web 主题信息搜集研究现状第9-10页
   ·论文研究内容及组织第10-12页
第二章 WEB 主题信息搜集技术第12-22页
   ·搜集主题的表示第12-13页
   ·种子URL 的确定第13页
   ·待访URL 的选取第13-15页
   ·网页下载第15-17页
     ·网页下载常用协议第16-17页
     ·网页下载第17页
   ·网页解析第17-19页
     ·HTML 文件标签树第17-19页
     ·网页正文抽取第19页
   ·WEB 重访第19-20页
   ·并行分布式搜集第20-21页
   ·本章小节第21-22页
第三章 基于带权语言网络的网页关键词抽取第22-29页
   ·复杂网络及复杂网络的中心度第22-25页
     ·复杂网络第22-23页
     ·复杂网络的中心度第23-25页
   ·带权语言网络第25-27页
     ·语言网络第25页
     ·语言网络的权第25-27页
   ·基于带权语言网络的网页关键词抽取第27-28页
     ·带权语言网络的词语权重度量第27页
     ·基于带权语言网络的关键词抽取算法第27-28页
   ·本章小节第28-29页
第四章 WEB 主题信息搜集策略第29-40页
   ·WEB 主题信息搜集问题第29-31页
     ·搜索及启发式搜索第29-30页
     ·Web 主题信息搜集形式化描述及算法第30-31页
   ·WEB 主题信息搜集中的领域知识第31-33页
     ·超链接建立目的第31页
     ·Web 主题信息分布规律第31-33页
   ·URL 价值测度第33-37页
     ·网页的主题相关性计算第33-35页
     ·URL 价值测度第35-37页
   ·提高信息召回率的措施第37-39页
   ·本章小节第39-40页
第五章 实验及结果分析第40-50页
   ·实验平台第40-42页
   ·网页关键词抽取实验及结果分析第42-44页
   ·WEB 主题信息搜集策略实验及结果分析第44-49页
     ·Web 主题信息搜集性能度量指标第44-45页
     ·启发式搜索中不同URL 价值测度方法的搜集性能比较第45-48页
     ·两种主题信息搜集策略的召回率比较第48-49页
   ·本章小节第49-50页
第六章 总结与展望第50-52页
   ·论文所做的主要工作第50页
   ·展望第50-52页
参考文献第52-55页
致谢第55-56页
附录A 论文部分源代码第56-67页
作者简介及在校期间发表论文第67页

论文共67页,点击 下载论文
上一篇:基础测绘成果管理系统与空间数据库动态更新研究
下一篇:图像处理在定量金相分析中的应用