首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息获取技术研究

摘要第1-4页
Abstract第4-6页
目录第6-8页
第一章 序论第8-12页
   ·问题提出第8页
   ·WEB信息获取技术的应用第8-9页
   ·WEB信息获取技术的发展现状第9页
   ·本文的工作第9-11页
   ·本文各章内容安排第11-12页
第二章 现有网络爬虫的几种搜索策略分析第12-18页
   ·搜索引擎的结构第12页
   ·宽度或深度优先搜索第12页
   ·聚焦搜索(focusedcrawler)第12-17页
     ·基于内容评价的搜索策略第13-14页
     ·基于链接结构评价的搜索策略第14-15页
     ·Rennie和McCallum的基于巩固学习方法的聚焦搜索第15-16页
     ·基于语境图的聚焦搜索第16-17页
   ·小结第17-18页
第三章 基于Citeseer文献搜索引擎的数据搜集与分析第18-28页
   ·Citeseer简介第18页
   ·Citeseer的索引原理第18-19页
     ·搜集文献第18页
     ·处理和分析文献第18-19页
     ·提问和浏览第19页
   ·基于Citeseer的文献数据搜集与分析第19-26页
     ·Citeseer搜索出的页面介绍第19-20页
     ·数据搜集与分析框架第20-26页
   ·实验结果第26-28页
第四章 文献质量评价第28-48页
   ·基于内容的文献质量评价第28-36页
     ·“语境图”的构造第28页
     ·文本的表示第28-30页
     ·后缀剥离第30页
     ·训练方法与分类算法第30-31页
     ·基于内容的文献质量评价的流程第31-33页
     ·实验结果第33-34页
     ·讨论第34-36页
   ·基于拓扑结构的文献质量评价第36-45页
     ·PageRank算法概述第36-37页
     ·随机冲浪模型第37-39页
     ·PageRank算法在Google搜索中的实现第39-40页
     ·出入链对PageRank值的影响第40-43页
     ·PageRank算法在本文中的物理意义及实验结果第43-45页
   ·基于内容和链接相结合的文献质量评价及知识决策系统框架的提出第45-47页
   ·小结第47-48页
第五章 总结与展望第48-50页
   ·本文总结第48页
   ·进一步的工作第48-50页
致谢第50-51页
参考文献第51-55页
附录A 硕士期间参与的科研项目第55页

论文共55页,点击 下载论文
上一篇:业务模板自动生成器
下一篇:液芯光纤喇曼光谱的研究