基于XML的Web内容挖掘研究

摘要	第1-4页
ABSTRACT	第4-9页
1 绪论	第9-16页
·问题的提出	第9-10页
·国内外同类研究综述	第10-14页
·数据挖掘研究综述	第10-11页
·Web 挖掘的研究进展	第11-14页
·本文完成的工作	第14-15页
·本文的组织结构	第15-16页
2 背景知识及相关技术	第16-43页
·数据挖掘	第16-28页
·数据挖掘的定义	第16-17页
·数据挖掘与相近学科、分析方法的对比	第17-22页
·数据挖掘研究的内容	第22-24页
·数据挖掘的方法和技术	第24-26页
·数据挖掘的流程	第26-28页
·WEB 挖掘	第28-35页
·Web 挖掘的含义	第29页
·Web 挖掘的分类	第29-32页
·Web 挖掘的复杂性分析	第32-34页
·Web 挖掘的基本过程	第34-35页
·XML 技术	第35-41页
·XML 产生的背景	第35页
·什么是 XML	第35-36页
·XML 相关的标准	第36-37页
·XML 的特点与优势	第37-39页
·XML 文档与数据库的转换	第39-41页
·本章小结	第41-43页
3 WEB 挖掘系统原型设计和数据源的预处理	第43-58页
·WEB 挖掘系统的逻辑架构	第43页
·WEB 挖掘系统原型设计	第43-47页
·Web 挖掘系统原型的工作机理	第44-45页
·Web 挖掘方法库的调用	第45-47页
·数据源预处理的相关工作	第47-48页
·基于栈结构的 HTML 到 XML 转换算法	第48-53页
·方法规划	第48-50页
·消除 HTML 的不严格语法	第50-52页
·数据的转换/提取——产生、输出 XML 文件	第52-53页
·实验及其分析	第53-55页
·运行结果	第54-55页
·结果分析	第55页
·多层次 WEB 数据库的建立	第55-56页
·本章小结	第56-58页
4 WEB 挖掘系统的挖掘算法设计	第58-66页
·WEB 挖掘系统中的多维数据分析	第58-59页
·WEB 挖掘系统原型中使用到的文本挖掘方法	第59-65页
·文本总结	第59页
·文本分类	第59-62页
·文本聚类	第62-64页
·关联分析	第64-65页
·本章小结	第65-66页
5 基于XML 的WEB 挖掘系统的实现	第66-71页
·WEB 挖掘系统原型的实现	第66页
·WEB 挖掘系统原型的运行	第66-70页
·对 WEB 挖掘系统原型运行结果的分析	第70-71页
6 总结与展望	第71-72页
致谢	第72-73页
参考文献	第73-75页
附录	第75页