摘要 | 第1-7页 |
Abstract | 第7-12页 |
第一章 绪论 | 第12-25页 |
·研究背景及意义 | 第12-15页 |
·Web挖掘概述 | 第15-20页 |
·Web挖掘的概念及特点 | 第15-16页 |
·Web挖掘分类 | 第16-20页 |
·本文工作 | 第20-25页 |
·论文的研究思路 | 第20-22页 |
·本文主要研究内容与贡献 | 第22-25页 |
第二章 研究综述 | 第25-38页 |
·引言 | 第25页 |
·Web文本挖掘国内外研究现状 | 第25-36页 |
·Web文本挖掘基本过程 | 第25-26页 |
·Web文本挖掘应用 | 第26-28页 |
·研究热点与动态 | 第28-32页 |
·商业应用及挖掘工具 | 第32-34页 |
·尚待研究解决的问题 | 第34-36页 |
·本章小结 | 第36-38页 |
第三章 基于Naive Bayesian的增强EM半监督分类研究 | 第38-50页 |
·引言 | 第38-39页 |
·非平衡集上的特征选择 | 第39-40页 |
·基于Naive Bayesian的增强EM算法 | 第40-44页 |
·朴素贝叶斯分类 | 第40-42页 |
·基本EM算法 | 第42-43页 |
·增强EM算法 | 第43-44页 |
·实验及结果分析 | 第44-49页 |
·实验数据与评测标准 | 第45页 |
·实验结果与分析 | 第45-49页 |
·本章小结 | 第49-50页 |
第四章 基于特征分布的半监督分类研究 | 第50-59页 |
·引言 | 第50-51页 |
·信息增益与特征分布 | 第51-52页 |
·基于特征分布选择 | 第52-53页 |
·实验及结果分析 | 第53-57页 |
·数据准备与评测标准 | 第54-55页 |
·实验结果与分析 | 第55-57页 |
·本章小结 | 第57-59页 |
第五章 基于强类别特征近邻传播的半监督聚类研究 | 第59-72页 |
·引言 | 第59-60页 |
·近邻消息传播算法 | 第60-62页 |
·AP算法与K-means算法的区别 | 第60-61页 |
·AP算法基本原理 | 第61-62页 |
·基于强类别特征AP半监督聚类 | 第62-65页 |
·夹角余弦系数相似性 | 第62-63页 |
·带强类别特征的相似性度量 | 第63-64页 |
·SCFAP半监督聚类算法 | 第64-65页 |
·实验及结果分析 | 第65-70页 |
·实验数据及准备 | 第65-66页 |
·实验评测标准 | 第66-67页 |
·实验结果与分析 | 第67-70页 |
·本章小结 | 第70-72页 |
第六章 融合种子扩散传播的半监督聚类研究 | 第72-85页 |
·引言 | 第72-73页 |
·种子扩散与净化 | 第73-75页 |
·融合种子扩散传播的半监督聚类 | 第75-78页 |
·实验及结果分析 | 第78-84页 |
·实验准备及评价函数 | 第78-79页 |
·实验比对算法 | 第79-80页 |
·实验结果与分析 | 第80-84页 |
·本章小结 | 第84-85页 |
第七章 基于语义信息和后缀树的Web检索结果聚类研究 | 第85-105页 |
·引言 | 第85-86页 |
·相关研究工作 | 第86-89页 |
·相关模型及理论 | 第89-94页 |
·向量空间模型 | 第89-91页 |
·后缀树模型 | 第91-93页 |
·潜在语义索引 | 第93-94页 |
·基于语义信息的Web片断后缀树聚类 | 第94-101页 |
·基于语义信息的Web片断STC过程 | 第94-95页 |
·Web文档预处理 | 第95-96页 |
·发现基簇 | 第96-98页 |
·合并基簇 | 第98-100页 |
·为基簇选择短语标签 | 第100-101页 |
·实验及结果分析 | 第101-104页 |
·实验准备与评测标准 | 第101-102页 |
·实验结果与分析 | 第102-104页 |
·本章小结 | 第104-105页 |
总结与展望 | 第105-108页 |
一.本文的主要工作和主要结论 | 第105-106页 |
二.本文的进一步研究方向 | 第106-108页 |
参考文献 | 第108-119页 |
攻读博士学位期间取得的研究成果 | 第119-121页 |
致谢 | 第121-122页 |
附件 | 第122页 |