摘要 | 第1-4页 |
Abstract | 第4-10页 |
第一章 绪论 | 第10-20页 |
·文本挖掘概述 | 第10-15页 |
·文本挖掘定义 | 第10-11页 |
·文本挖掘的过程 | 第11-13页 |
·文本挖掘的主要应用 | 第13-14页 |
·文本挖掘的难点问题 | 第14-15页 |
·课题背景与研究意义 | 第15-17页 |
·本文研究内容及成果 | 第17-18页 |
·本文结构安排 | 第18-19页 |
·本章小结 | 第19-20页 |
第二章 国内外研究现状分析 | 第20-30页 |
·文本表示模型 | 第20-21页 |
·文本特征降维 | 第21-22页 |
·文本分类方法 | 第22-24页 |
·文本关联分析 | 第24-25页 |
·性能评估 | 第25-28页 |
·基准数据集 | 第28-29页 |
·本章小结 | 第29-30页 |
第三章 基于向量空间模型的特征权重算法研究 | 第30-41页 |
·引言 | 第30页 |
·向量空间模型 | 第30-31页 |
·传统的特征权重计算方法 | 第31-32页 |
·特征项频率 | 第31页 |
·反文档频率 | 第31-32页 |
·tf~*idf权重 | 第32页 |
·改进的tf~*idf特征权重算法研究 | 第32-37页 |
·tf~*idf特征权重算法局限性 | 第32-34页 |
·tf~*idf特征权重算法改进 | 第34-35页 |
·综合风险信息的特征权重计算 | 第35-37页 |
·实验结果与分析 | 第37-40页 |
·改进的tf~*idf权重实验 | 第37-39页 |
·综合风险信息权重的实验 | 第39-40页 |
·本章小结 | 第40-41页 |
第四章 基于ReliefF与RMI评估的特征选择方法研究 | 第41-60页 |
·引言 | 第41-42页 |
·特征选择概述 | 第42-45页 |
·特征选择定义 | 第42页 |
·特征选择的理论框架 | 第42-43页 |
·特征选择类型 | 第43-44页 |
·评价机制 | 第44-45页 |
·文本特征选择方法 | 第45-47页 |
·文档频率 | 第45页 |
·互信息 | 第45页 |
·信息增益 | 第45-46页 |
·交叉熵 | 第46页 |
·x~2-统计量 | 第46-47页 |
·一种组合式的文本特征选择 | 第47-58页 |
·传统文本特征选择的局限 | 第47页 |
·特征相关性与冗余性 | 第47-49页 |
·连续属性离散化 | 第49-54页 |
·ReliefF算法介绍 | 第54-56页 |
·ReliefF结合RMI的特征选择方法 | 第56-58页 |
·实验及分析 | 第58-59页 |
·本章小结 | 第59-60页 |
第五章 基于可信度AttributeBagging的文本分类器研究 | 第60-79页 |
·集成学习算法概述 | 第60-65页 |
·集成学习定义及框架 | 第60-61页 |
·典型的集成学习算法 | 第61-64页 |
·Bagging算法的理论分析 | 第64-65页 |
·常用的文本分类方法 | 第65-68页 |
·Rocchio | 第65-66页 |
·朴素贝叶斯 | 第66页 |
·K最近邻 | 第66-67页 |
·支持向量机 | 第67-68页 |
·其他分类方法 | 第68页 |
·基于Bagging的文本分类算法研究 | 第68-78页 |
·基于C4.5Bagging的文本分类算法 | 第68-71页 |
·基于Attribute Bagging的文本分类算法 | 第71-74页 |
·可信度Attribute Bagging的文本分类算法 | 第74-78页 |
·本章小结 | 第78-79页 |
第六章 基于灰色关联分析的主题词提取研究 | 第79-93页 |
·关联规则概述 | 第79-84页 |
·关联规则基本定义及度量 | 第79-80页 |
·经典关联规则算法 | 第80-84页 |
·灰色关联规则分析 | 第84-87页 |
·灰色理论概述 | 第84-85页 |
·灰色关联空间 | 第85-87页 |
·综合风险信息的主题词提取 | 第87-90页 |
·频繁1-项集的集合构成 | 第88-89页 |
·主题词的灰色关联度 | 第89-90页 |
·算法描述 | 第90页 |
·实验结果及分析 | 第90-92页 |
·本章小结 | 第92-93页 |
第七章 基于主题爬虫的综合风险信息采集与分类的设计实现 | 第93-101页 |
·引言 | 第93-95页 |
·通用搜索与主题搜索 | 第93-94页 |
·网络主题爬虫 | 第94-95页 |
·系统设计与实现 | 第95-99页 |
·系统框架与主要模块 | 第95-97页 |
·系统功能及运行 | 第97-99页 |
·主题相关性实验 | 第99-100页 |
·本章小结 | 第100-101页 |
第八章 结束语 | 第101-103页 |
·工作总结 | 第101-102页 |
·研究展望 | 第102-103页 |
参考文献 | 第103-114页 |
攻读博士学位期间取得的科研成果 | 第114-116页 |
致谢 | 第116页 |