Web结构挖掘中HITS算法的优化与实现

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-16页
·课题背景和研究意义	第10-11页
·Web 结构挖掘算法的发展和研究现状	第11-14页
·本文主要研究工作和创新点	第14-15页
·论文结构	第15-16页
第二章 Web 数据挖掘	第16-22页
·Web挖掘的定义	第16-17页
·Web 挖掘的分类	第17-19页
·Web 内容挖掘	第17-18页
·Web 结构挖掘	第18页
·Web 使用挖掘	第18-19页
·Web 挖掘中的关键技术	第19-21页
·路径分析技术	第20页
·关联规则挖掘技术	第20页
·序列模式挖掘技术	第20页
·聚类分类技术	第20-21页
·Web 数据挖掘的实现	第21-22页
第三章 Web 链接结构分析	第22-33页
·Web 链接结构分析产生的背景	第22-23页
·Web 链接结构分析模型	第23-26页
·图模型	第23-25页
·马尔可夫模型（Markov Model）	第25页
·最大流模型（Maximal Flow Model）	第25-26页
·概率关系模型（Probabilistic Relational Model）	第26页
·其它模型	第26页
·Web 链接的结构和特点	第26-28页
·链接结构分析算法	第28-31页
·网页聚簇性分析算法	第28-29页
·网页权值分析算法	第29-31页
·Web 链接结构分析在 Web 信息检索中的应用	第31-33页
·网页评价	第31页
·网页分类	第31-32页
·主题提取	第32-33页
第四章主题提取算法——HITS	第33-46页
·HITS 算法的基本思想	第33-35页
·HITS 算法的具体过程	第35-40页
·构造Web 链接结构子图	第35-37页
·迭代式链接分析计算	第37-40页
·评价与分析	第40-43页
·一些对 HITS 算法的改进	第43-46页
·ARC 算法——IBM 研究中心对HITS 算法的改进	第44页
·Average 算法和Sim 算法	第44-46页
第五章对HITS 算法的改进——W-HITS 算法	第46-57页
·改进的总体思路	第46页
·更有效的选取基集	第46-49页
·站内链接的排除	第47页
·非站内无效链接的排除	第47-49页
·基于内容分析的节点加权和修剪	第49-55页
·向量空间模型	第50-54页
·链接结构子图节点主题的向量表示	第54页
·查询主题的向量表示	第54页
·Web 节点和查询主题的相似度计算	第54-55页
·确定权重阈值修剪低相关度的节点	第55页
·结合内容相关性分析的W-HITS 算法	第55-56页
·W-HITS 算法小结	第56-57页
·改善不合理的结果	第56页
·控制主题偏移	第56页
·W-HITS 算法的应用	第56-57页
第六章 W-HITS 算法的实验验证和分析讨论	第57-66页
·实验方案	第57-58页
·实验系统设计	第58-62页
·系统结构	第58-59页
·链接结构子图构造模块	第59-61页
·节点加权模块	第61-62页
·迭代加权模块	第62页
·实验结果分析讨论	第62-66页
结论	第66-67页
致谢	第67-68页
参考文献	第68-73页
攻读学位期间发表的论文	第73页