基于本体的Web页面聚类挖掘
摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 绪论 | 第9-13页 |
·课题的背景和意义 | 第9-10页 |
·领域研究的现状 | 第10-11页 |
·文本聚类的研究现状 | 第10-11页 |
·本体的研究现状 | 第11页 |
·课题研究的主要内容 | 第11页 |
·文本聚类 | 第11页 |
·本体 | 第11页 |
·本文的组织安排 | 第11-13页 |
第二章 文本聚类挖掘与本体 | 第13-44页 |
·文本聚类挖掘 | 第13-28页 |
·自动分词技术 | 第14-15页 |
·特征表示与提取 | 第15-19页 |
·文本的表示模型 | 第19-24页 |
·常用的文本聚类算法 | 第24-28页 |
·本体 | 第28-43页 |
·本体解析 | 第30-38页 |
·语义相似度计算模型 | 第38-43页 |
·本章小结 | 第43-44页 |
第三章 基于本体的Web页面聚类挖掘 | 第44-57页 |
·基于本体的Web页面聚类挖掘模型 | 第44-45页 |
·本体的应用 | 第45-49页 |
·应用本体 | 第45-47页 |
·映射规则 | 第47页 |
·概念的相似性计算 | 第47-49页 |
·预处理 | 第49-52页 |
·网页信息分析 | 第49-51页 |
·文档预处理 | 第51-52页 |
·基于本体的VSM表示模型 | 第52-54页 |
·OntK_mans的聚类算法 | 第54-56页 |
·文档的相似性计算 | 第54页 |
·聚类过程描述 | 第54-56页 |
·测试评估 | 第56页 |
·本章小结 | 第56-57页 |
第四章 实验与评价 | 第57-61页 |
·实验数据准备 | 第57页 |
·聚类结果精确度分析 | 第57-59页 |
·评估方法 | 第57-58页 |
·比较分析 | 第58-59页 |
·结果的可解释性 | 第59-60页 |
·本章小结 | 第60-61页 |
第五章 系统的设计与实现 | 第61-69页 |
·系统的功能模块的设计 | 第61-67页 |
·页面收集模块 | 第61-63页 |
·本体的应用模块 | 第63-65页 |
·聚类分析模块 | 第65-67页 |
·系统的具体实现 | 第67-68页 |
·本章小结 | 第68-69页 |
第六章 结论 | 第69-71页 |
·本文的总结 | 第69页 |
·进一步的展望 | 第69-71页 |
参考文献 | 第71-75页 |
致谢 | 第75-77页 |
附录A 攻读硕士学位期间发表的论文 | 第77页 |