首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于网页结构相关性预取技术研究

摘要第1-4页
Abstract第4-8页
第一章 绪论第8-14页
   ·课题的背景和意义第8-10页
   ·研究课题描述第10-12页
   ·主要工作与内容安排第12-14页
     ·主要工作第12-13页
     ·内容安排第13-14页
第二章 WEB预取的特点及方法第14-25页
   ·预取技术研究的可行性第14-16页
   ·预取的分类第16-21页
     ·客户(浏览器)端预取第16-17页
     ·代理服务器端预取第17-19页
     ·服务器端预取第19-21页
   ·预取算法分析第21-24页
     ·基于历史(History Based)的预取第22页
     ·基于链接(link Based)的预取第22-23页
     ·基于兴趣(interest based)的预取第23-24页
   ·本章小结第24-25页
第三章 WEB的结构相关性第25-31页
   ·一个页面内部的半结构化数据资源具有结构相关性第25-26页
   ·文档 URL中的目录路径具有结构相关性第26页
   ·网页之间的超链接具有结构相关性第26-30页
     ·超链接标志第26-27页
     ·超链的有向图第27-28页
     ·网页中链分布特点第28-30页
   ·本章小结第30-31页
第四章 隐马尔可夫模型( HMM)第31-37页
   ·隐马尔可夫模型基本思想第31-33页
     ·隐马尔可夫模型第31-32页
     ·HMM定义第32-33页
   ·隐马尔可夫模型的三个基本问题第33-35页
     ·识别问题的解决第33-34页
     ·前向—后向算法第34-35页
   ·用户访问行为的 Markov性第35-36页
   ·本章小结第36-37页
第五章 基于网页结构相关性的预取模型第37-49页
   ·Web简化模型描述第37-38页
   ·代理服务器 Log预处理第38-39页
   ·基于网页结构相关性的 Web信息提取第39-46页
     ·信息提取技术第39页
     ·建立特征词词典第39-41页
     ·TF-IDF算法及其改进第41-43页
     ·特征向量维数压缩第43页
     ·特征项权重的计算方法第43-45页
     ·特征词提取过程第45-46页
   ·用户访问序列的输出概率第46-48页
   ·本章小结第48-49页
第六章 基于网页结构相关性预取模型实现第49-60页
   ·预取系统与代理服务器的衔接第49页
   ·预取系统的结构第49-54页
     ·离线挖掘用户的会话集第50-52页
     ·在线预取子系统第52-54页
   ·实验结果及分析第54-59页
     ·性能评价指标第54-55页
     ·实验设计第55-57页
     ·测试结果分析第57-59页
   ·本章小结第59-60页
第七章 结论与展望第60-61页
   ·结论第60页
   ·不足和展望第60-61页
参考文献第61-65页
附录1 攻读硕士期间发表学术论文第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:相异地质条件下渡槽结构多点地震输入响应分析
下一篇:农业信息化经济学理论基础探索