基于机器学习的主题Web挖掘技术

摘要	第1-8页
ABSTRACT	第8-10页
第一章绪论	第10-14页
·研究背景	第10-11页
·Web挖掘与相关研究内容	第11-12页
·Web挖掘与数据挖掘	第11页
·Web挖掘与信息检索	第11-12页
·Web挖掘与信息提取	第12页
·本文研究内容及结构	第12-14页
第二章 Web挖掘理论简介	第14-21页
·Web挖掘的定义	第14-15页
·Web挖掘的分类	第15-17页
·Web内容挖掘	第15-16页
·Web结构挖掘	第16页
·Web使用记录挖掘	第16-17页
·国内外研究动态	第17-18页
·主题 Web挖掘理论	第18-19页
·主题页面在 Web上的分布特征	第19-20页
·本章小结	第20-21页
第三章机器学习理论简介	第21-28页
·机器学习概述	第21-23页
·机器学习的模型	第21页
·机器学习分类	第21-22页
·机器学习发展历程	第22-23页
·机器学习方法在 Web挖掘中的应用	第23页
·强化学习	第23-25页
·强化学习的基本原理和模型	第23-24页
·Q学习	第24-25页
·贝叶斯学习	第25-27页
·贝叶斯学习法则	第25-26页
·朴素贝叶斯分类器	第26-27页
·本章小结	第27-28页
第四章主题爬虫模型及算法研究	第28-39页
·通用爬虫模型	第28-29页
·主题爬虫概述	第29-31页
·主题爬虫的定义	第29-30页
·研究现状	第30-31页
·主题爬虫存在的问题	第31页
·基于机器学习的主题爬虫算法	第31-38页
·在线Q值计算	第32-34页
·在线生成正反例样本库	第34-35页
·超链接上下文到Q值的映射	第35-36页
·基于机器学习的主题爬虫爬行策略的主要步骤	第36-37页
·实验结果及分析	第37-38页
·本章小结	第38-39页
第五章基于内容和超链接的页面重要性挖掘算法	第39-43页
·HITS算法	第39-40页
·WHITS算法	第40-42页
·算法描述	第40-41页
·修整目标集合	第41页
·计算网页的相关度权值	第41-42页
·本章小结	第42-43页
第六章主题Web挖掘系统	第43-46页
·主题爬虫爬虫模块	第43-44页
·超链接分析模块	第44页
·反馈模块	第44-45页
·用户接口模块	第45-46页
第七章总结与展望	第46-48页
·总结	第46页
·下一步工作	第46-48页
参考文献	第48-51页
攻读硕士学位期间发表的论文和参与的项目	第51-52页
致谢	第52页