摘要 | 第1-8页 |
Abstract | 第8-13页 |
第一章 文本与Web采掘的研究现状 | 第13-41页 |
·数据采掘综述 | 第13-17页 |
·数据采掘的概念和过程 | 第13-16页 |
·数据采掘的分类 | 第16-17页 |
·文本数据采掘 | 第17-23页 |
·WEB采掘 | 第23-30页 |
·Web内容采掘 | 第24-26页 |
·Web结构采掘 | 第26-27页 |
·Web用法采掘 | 第27-29页 |
·WEB采掘与其它研究的关系 | 第29-30页 |
·本文的研究背景、内容 | 第30-41页 |
·研究背景 | 第30-35页 |
·本文的研究内容和意义 | 第35-41页 |
第二章 用数据采掘方法获取汉语词性标注规则 | 第41-51页 |
·问题的描述 | 第42-44页 |
·词性标注规则的采掘算法与应用 | 第44-47页 |
·实验结果 | 第47-49页 |
·初步结果 | 第47-48页 |
·规则的归纳 | 第48-49页 |
·小结 | 第49-51页 |
第三章 用户兴趣的采掘与发现 | 第51-59页 |
·交互式获取用户兴趣 | 第52-56页 |
·特征词的作用及辨识 | 第52-53页 |
·静态用户兴趣文件学习算法 | 第53-56页 |
·基于AGENT 的用户兴趣源的动态获取和更新 | 第56-58页 |
·小结 | 第58-59页 |
第四章 基于网页分割的 WEB检索 | 第59-73页 |
·介绍 | 第59-61页 |
·相关的工作 | 第61-62页 |
·网页的预处理 | 第62-67页 |
·HTML 标记树 | 第62-64页 |
·HTML 标记树的分割 | 第64-67页 |
·排序算法 | 第67-68页 |
·实验结果 | 第68-72页 |
·结论 | 第72-73页 |
第五章 概念语义空间与相似性度量 | 第73-85页 |
·概念语义空间简介 | 第73页 |
·概念语义空间的形成 | 第73-78页 |
·概念语义空间与相似性度量 | 第78-83页 |
·概念语义空间和信息检索 | 第78-79页 |
·基于概念语义空间的相似性度量 | 第79-83页 |
·小结 | 第83-85页 |
第六章 网页信息分类研究 | 第85-111页 |
·文本(网页)分类方法综述 | 第85-88页 |
·近邻学习算法(Nearest Neighbour) | 第85-86页 |
·决策树 | 第86页 |
·统计分类 | 第86-87页 |
·神经网络 | 第87-88页 |
·基于支持向量机与无监督聚类相结合的网页分类 | 第88-111页 |
·研究背景 | 第88-89页 |
·中文网页的表示方法(基于视觉特征的文本表示) | 第89-92页 |
·SVM 与无监督聚类(UC)相结合的网页分类 | 第92-97页 |
·超链在分类中的作用 | 第97-100页 |
·试验结果 | 第100-103页 |
·实验系统 | 第103-111页 |
第七章 展望与结论 | 第111-115页 |
·本文的总结 | 第111-113页 |
·前景和展望 | 第113-115页 |
参考文献 | 第115-130页 |
作者简历 | 第130页 |
攻读博士学位期间发表的主要论文 | 第130-131页 |
攻读博士学位期间参加的主要科研项目 | 第131页 |
攻读博士学位期间的获奖情况 | 第131-132页 |
致谢 | 第132页 |