首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

效用驱动的主题Web挖掘算法研究

摘要第1-9页
ABSTRACT第9-11页
第一章 绪论第11-17页
   ·课题研究背景及意义第11-13页
     ·Internet的发展和Web资源第11-12页
     ·面向主题的Web挖掘的产生第12-13页
   ·国内外研究现状第13-15页
     ·目前主要研究内容第13-14页
     ·现有的研究成果第14-15页
     ·目前研究中存在的问题第15页
   ·本文的主要内容及结构第15-17页
第二章 主题Web挖掘第17-28页
   ·通用搜索引擎第17-20页
     ·通用搜索引擎的基本结构和工作原理第17-18页
     ·通用搜索引擎的分类第18-19页
     ·通用搜索引擎的现状及其局限性第19-20页
   ·主题Web挖掘第20-27页
     ·主题Web挖掘简介第20-21页
     ·主题Web挖掘研究背景第21页
     ·主题Web挖掘研究任务第21-25页
     ·主题爬虫关键技术第25-26页
     ·主题Web挖掘和通用搜索引擎的关系第26-27页
   ·本章小结第27-28页
第三章 主题爬虫搜索策略算法研究第28-39页
   ·主题爬虫的搜索策略第28-33页
     ·基于内容评价的搜索策略第29页
     ·基于Web超链接结构的搜索策略第29-30页
     ·基于未来回报价值评价的搜索策略第30-32页
     ·基于"综合价值"评价的搜索策略第32页
     ·基于"动态"价值评价的搜索策略第32-33页
     ·主题爬虫搜索策略的比较第33页
   ·基于索引的增量搜索策略第33-38页
     ·增量Web信息提取概述第34页
     ·RSS/Atom在增量Web信息提取中的应用第34-36页
     ·索引页概念的分析与提出第36页
     ·基于索引页的增量Web信息提取算法第36-38页
   ·主题爬虫的搜索策略研究趋势第38页
   ·本章小结第38-39页
第四章 基于超链接结构的Web检索算法第39-48页
   ·超链接结构的特性及其应用第39-40页
   ·基于超链接结构的Web检索算法第40-42页
     ·Page Rank算法第40-41页
     ·Hits算法第41页
     ·Page Rank算法和Hits算法比较第41-42页
   ·超链接算法的一种改进——基于向量空间模型的超链接算法第42-45页
     ·向量空间模型(VSM)第42-43页
     ·基于向量空间模型的超链接算法第43-45页
   ·超链接算法的分类及其评价第45-46页
   ·本章小结第46-48页
第五章 主题爬虫的设计与实现第48-55页
   ·主题爬虫的设计方案第48-50页
     ·主题爬虫的系统结构第48-49页
     ·主题确立模块第49页
     ·初始种子模块第49页
     ·主题相关度分析模块第49-50页
     ·排序模块第50页
   ·主题爬虫的实现第50-53页
     ·URL队列的维护第50-51页
     ·数据库结构第51-52页
     ·全文索引第52页
     ·爬行速度控制第52页
     ·开发环境第52页
     ·部分关键代码段示例第52-53页
     ·实验结果分析第53页
   ·本章小结第53-55页
第六章 总结与展望第55-56页
   ·本文的主要工作第55页
   ·进一步的研究方向第55-56页
参考文献第56-60页
攻读硕士学位期间发表的论文和参与的项目第60-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:生存素及血管内皮生长因子在大肠癌组织中的表达及临床意义
下一篇:海绵和海星等海洋无脊椎动物中有关化学成分的研究