第一章 绪论 | 第7-10页 |
1.1 问题的提出 | 第7-8页 |
1.2 问题的解决方案 | 第8页 |
1.3 本文的工作和组织 | 第8-10页 |
第二章 基于主题特征词的Web页面分类挖掘 | 第10-24页 |
2.1 Web数据挖掘的定义 | 第10-11页 |
2.2 Web数据挖掘的分类 | 第11-12页 |
2.2.1 Web内容挖掘 | 第11-12页 |
2.2.2 Web结构挖掘 | 第12页 |
2.2.3 Web日志挖掘 | 第12页 |
2.3 Web文本挖掘 | 第12-14页 |
2.3.1 文本总结 | 第12页 |
2.3.2 文本分类 | 第12-13页 |
2.3.3 文本聚类 | 第13页 |
2.3.4 关联规则 | 第13-14页 |
2.4 基于主题特征词的Web文本分类挖掘 | 第14-20页 |
2.4.1 Web数据预处理 | 第14页 |
2.4.2 文本表示 | 第14-15页 |
2.4.3 特征提取 | 第15-17页 |
2.4.4 分类和评估 | 第17-20页 |
2.5 一个已有Web页面分类数据挖掘系统 | 第20-24页 |
2.5.1 系统介绍 | 第20-22页 |
2.5.2 系统分析 | 第22-24页 |
第三章 本体 | 第24-29页 |
3.1 本体的定义 | 第24-25页 |
3.2 本体的作用 | 第25页 |
3.3 本体的种类 | 第25-26页 |
3.4 本体的建模语言 | 第26-27页 |
3.5 本体的描述 | 第27-29页 |
3.5.1 用RDF(S)元语建立Ontology | 第27-28页 |
3.5.2 RDF(S)元语集合的扩展 | 第28-29页 |
第四章 基于本体的Web页面分类挖掘 | 第29-53页 |
4.1 基于本体的Web页面分类挖掘模型 | 第29-30页 |
4.2 应用本体 | 第30-33页 |
4.3 本体解析 | 第33-35页 |
4.3.1 一致性映射规则 | 第34页 |
4.3.2 推理映射规则 | 第34页 |
4.3.3 上下文映射规则 | 第34页 |
4.3.4 关系映射规则 | 第34-35页 |
4.4 Html页面解析 | 第35-38页 |
4.5 本体匹配 | 第38-40页 |
4.6 相关度向量计算 | 第40-44页 |
4.6.1 密度算法 | 第41-42页 |
4.6.2 期望值算法 | 第42-44页 |
4.6.3 1max集合算法: | 第44页 |
4.7 学习算法 | 第44-48页 |
4.8 分类过程描述 | 第48-51页 |
4.8.1 基本分类过程 | 第48-49页 |
4.8.2 改进后的分类过程 | 第49-51页 |
4.9 测试评估 | 第51-53页 |
第五章 研究实验及其说明 | 第53-60页 |
5.1 实验描述 | 第53-55页 |
5.1.1 原型系统 | 第53-54页 |
5.1.2 实验过程 | 第54-55页 |
5.2 验证实验说明和分析 | 第55-57页 |
5.2.1 实验1 | 第55页 |
5.2.2 实验2 | 第55-56页 |
5.2.3 实验3 | 第56-57页 |
5.3 对比实验说明和分析 | 第57-60页 |
5.3.1 实验4 | 第57-58页 |
5.3.2 实验5 | 第58-60页 |
第六章 结束语 | 第60-61页 |
6.1 本文的总结 | 第60页 |
6.2 进一步的研究方向 | 第60-61页 |
参考文献 | 第61-65页 |
致谢 | 第65-66页 |
攻读学位期间主要的研究成果 | 第66页 |