Web结构挖掘算法研究及改进

摘要	第1-3页
Abstract	第3-8页
第1章绪论	第8-14页
·研究背景和意义	第8页
·Web 的发展历程	第8-10页
·Web 数据挖掘面临的问题	第10-12页
·Web 数据挖掘的研究现状	第12-13页
·文章的组织结构	第13-14页
第2章 Web 数据挖掘	第14-24页
·Web 数据的特点	第14-15页
·Web 数据挖掘的分类	第15-19页
·Web 结构挖掘	第16-17页
·Web 内容挖掘	第17页
·Web 用户性质挖掘	第17-18页
·Web 日志挖掘	第18-19页
·Web 数据挖掘的应用	第19-21页
·应用于电子商务	第19-20页
·应用于搜索引擎	第20页
·应用于网站设计	第20-21页
·Web 数据挖掘中的关键技术	第21页
·路径分析技术	第21页
·关联规则挖掘技术	第21页
·序列模式挖掘技术	第21页
·聚类分类技术	第21页
·本章小结	第21-24页
第3章 Web 数据挖掘流程	第24-34页
·前提条件	第24-25页
·系统框架	第25-26页
·网页信息收集	第26-28页
·信息的预处理	第28-30页
·关键词的提取	第28-29页
·重复或转载网页的消除	第29页
·链接分析	第29-30页
·网页重要程度的计算	第30页
·查询信息	第30-33页
·查询方式和匹配	第31-32页
·结果排序	第32页
·文档摘要	第32-33页
·本章小结	第33-34页
第4章基于可信度模型的HITS	第34-52页
·主题相关度	第34-43页
·Web 结构挖掘与信息检索	第35-36页
·Web 挖掘模型	第36-38页
·倒排文档索引技术	第38-39页
·关键词权重	第39-41页
·评价指标	第41-43页
·原始HITS 算法	第43-47页
·HITS 算法的基本思想	第44-45页
·HITS 存在的问题	第45-47页
·改进后的算法T-HITS	第47-50页
·链接文本与主题相关度的计算	第47-49页
·可信度模型的建立	第49页
·可信链接集即白名单集合W 的确定	第49页
·寻找垃圾链接集即黑名单集合B	第49-50页
·未知链接集合U	第50页
·计算网页的可信度T	第50页
·最终分数的确定	第50页
·本章小结	第50-52页
第5章实验方案	第52-60页
·实验系统的设计	第52页
·实验系统的实现	第52-55页
·开发环境	第52-53页
·数据获取模块	第53-54页
·过滤器模块	第54页
·索引模块	第54页
·查询模块	第54-55页
·实验结果评价	第55-58页
·本章小结	第58-60页
结论与展望	第60-62页
参考文献	第62-66页
攻读学位期间发表的学术论文	第66-68页
致谢	第68-69页
详细摘要	第69-74页