首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web结构挖掘算法研究及改进

摘要第1-3页
Abstract第3-8页
第1章 绪论第8-14页
   ·研究背景和意义第8页
   ·Web 的发展历程第8-10页
   ·Web 数据挖掘面临的问题第10-12页
   ·Web 数据挖掘的研究现状第12-13页
   ·文章的组织结构第13-14页
第2章 Web 数据挖掘第14-24页
   ·Web 数据的特点第14-15页
   ·Web 数据挖掘的分类第15-19页
     ·Web 结构挖掘第16-17页
     ·Web 内容挖掘第17页
     ·Web 用户性质挖掘第17-18页
     ·Web 日志挖掘第18-19页
   ·Web 数据挖掘的应用第19-21页
     ·应用于电子商务第19-20页
     ·应用于搜索引擎第20页
     ·应用于网站设计第20-21页
   ·Web 数据挖掘中的关键技术第21页
     ·路径分析技术第21页
     ·关联规则挖掘技术第21页
     ·序列模式挖掘技术第21页
     ·聚类分类技术第21页
   ·本章小结第21-24页
第3章 Web 数据挖掘流程第24-34页
   ·前提条件第24-25页
   ·系统框架第25-26页
   ·网页信息收集第26-28页
   ·信息的预处理第28-30页
     ·关键词的提取第28-29页
     ·重复或转载网页的消除第29页
     ·链接分析第29-30页
     ·网页重要程度的计算第30页
   ·查询信息第30-33页
     ·查询方式和匹配第31-32页
     ·结果排序第32页
     ·文档摘要第32-33页
   ·本章小结第33-34页
第4章 基于可信度模型的HITS第34-52页
   ·主题相关度第34-43页
     ·Web 结构挖掘与信息检索第35-36页
     ·Web 挖掘模型第36-38页
     ·倒排文档索引技术第38-39页
     ·关键词权重第39-41页
     ·评价指标第41-43页
   ·原始HITS 算法第43-47页
     ·HITS 算法的基本思想第44-45页
     ·HITS 存在的问题第45-47页
   ·改进后的算法T-HITS第47-50页
     ·链接文本与主题相关度的计算第47-49页
     ·可信度模型的建立第49页
     ·可信链接集即白名单集合W 的确定第49页
     ·寻找垃圾链接集即黑名单集合B第49-50页
     ·未知链接集合U第50页
     ·计算网页的可信度T第50页
     ·最终分数的确定第50页
   ·本章小结第50-52页
第5章 实验方案第52-60页
   ·实验系统的设计第52页
   ·实验系统的实现第52-55页
     ·开发环境第52-53页
     ·数据获取模块第53-54页
     ·过滤器模块第54页
     ·索引模块第54页
     ·查询模块第54-55页
   ·实验结果评价第55-58页
   ·本章小结第58-60页
结论与展望第60-62页
参考文献第62-66页
攻读学位期间发表的学术论文第66-68页
致谢第68-69页
详细摘要第69-74页

论文共74页,点击 下载论文
上一篇:广义大系统的非脆弱分散控制
下一篇:结构化P2P匿名通信系统研究