摘要 | 第1-6页 |
ABSTRACT | 第6-16页 |
第一章 绪论 | 第16-24页 |
·文本挖掘技术 | 第16-20页 |
·文本挖掘研究现状 | 第16-17页 |
·文本挖掘热点难点问题 | 第17-19页 |
·文本挖掘应用 | 第19-20页 |
·文本聚类方法研究 | 第20-22页 |
·文本聚类研究现状 | 第21页 |
·文本聚类研究所关注的问题 | 第21-22页 |
·本文的研究内容 | 第22-23页 |
·本文的组织结构 | 第23-24页 |
第二章 基于关联规则的文本建模方法研究 | 第24-36页 |
·向量空间模型 | 第24-26页 |
·特征项的选取和权重的计算 | 第25页 |
·基于词的向量空间模型 | 第25-26页 |
·向量空间模型的构建 | 第26-30页 |
·中文文本数据建模 | 第27-29页 |
·英文文本数据建模 | 第29-30页 |
·基于关联规则的向量空间模型 | 第30-33页 |
·向量空间模型存在的问题 | 第30-31页 |
·向量空间模型的关联分析 | 第31-32页 |
·构建向量空间模型的增量更新方法 | 第32-33页 |
·实例 | 第33-35页 |
·小结 | 第35-36页 |
第三章 基于非负矩阵分解的文本聚类方法研究 | 第36-52页 |
·非负矩阵分解方法研究 | 第36-37页 |
·非负矩阵分解方法综述 | 第36-37页 |
·非负矩阵分解的理论基础 | 第37页 |
·非负矩阵分解算法理论分析 | 第37-41页 |
·乘性更新算法 | 第37-38页 |
·投影梯度算法 | 第38页 |
·基于秩1的迭代算法(RRI) | 第38-39页 |
·关于FCM算法和NMF算法的讨论 | 第39-40页 |
·关于迭代算法终止条件的讨论 | 第40-41页 |
·基于矩阵变换的快速非负矩阵分解 | 第41-45页 |
·算法推导 | 第41-43页 |
·基于矩阵变换的交替最小平方算法 | 第43-44页 |
·改进的TM-ALS算法 | 第44-45页 |
·复杂度分析 | 第45页 |
·文本聚类的评价方法 | 第45-46页 |
·查准率、查全率和F测量值 | 第45-46页 |
·silhouette值 | 第46页 |
·实验仿真 | 第46-51页 |
·随机非负矩阵 | 第47-49页 |
·TanCorp数据集 | 第49-50页 |
·Reuters数据集 | 第50-51页 |
·小结 | 第51-52页 |
第四章 核聚类方法研究 | 第52-66页 |
·核函数基础知识 | 第52-54页 |
·核函数理论 | 第52-53页 |
·常用核函数 | 第53-54页 |
·核聚类方法 | 第54-59页 |
·核聚类算法(KCM) | 第54-55页 |
·模糊核聚类算法(FKCM) | 第55-56页 |
·改进的模糊核聚类算法(IFKCM) | 第56页 |
·实验仿真 | 第56-59页 |
·基于语义核的局部自适应聚类算法研究 | 第59-65页 |
·局部自适应算法(LAC) | 第60-61页 |
·基于高斯语义核的局部自适应聚类算法 | 第61-62页 |
·实验仿真 | 第62-65页 |
·小结 | 第65-66页 |
第五章 基于NMF的层次聚类方法 | 第66-80页 |
·层次聚类方法 | 第66-68页 |
·凝聚层次聚类(HAC)方法 | 第66-67页 |
·划分层次聚类(HPC) | 第67-68页 |
·划分和凝聚结合 | 第68页 |
·基于NMF的划分层次聚类方法 | 第68-70页 |
·聚类数目的确定 | 第68-69页 |
·计算复杂度分析 | 第69页 |
·基于特征-文档矩阵V进行底层聚类划分的层次聚类算法 | 第69-70页 |
·基于NMF的混合划分凝聚层次聚类方法 | 第70页 |
·仿真 | 第70-75页 |
·随机数据矩阵仿真 | 第71-73页 |
·TanCorp数据仿真 | 第73-75页 |
·聚类表示方法 | 第75-78页 |
·基于NMF的聚类表示方法 | 第75-76页 |
·基于Testor理论的聚类表示 | 第76-78页 |
·小结 | 第78-80页 |
第六章 文本挖掘方法在科研信息领域的应用 | 第80-90页 |
·基于文本挖掘技术的科研信息自动建议系统 | 第80-81页 |
·系统设计 | 第81-84页 |
·信息领域科技文献文本数据的特点 | 第81-82页 |
·系统结构 | 第82-83页 |
·开发环境 | 第83-84页 |
·系统各模块功能 | 第84-86页 |
·数据采集模块 | 第84页 |
·科研文档数据预处理 | 第84页 |
·文本建模 | 第84-85页 |
·文本挖掘模块 | 第85-86页 |
·建议生成、知识管理模块 | 第86页 |
·辅助工具的开发 | 第86-88页 |
·用户接口部分 | 第86-87页 |
·中英文混合分词处理 | 第87页 |
·科研文档建模工具 | 第87-88页 |
·实例 | 第88-89页 |
·小结 | 第89-90页 |
第七章 结论与展望 | 第90-92页 |
·结论 | 第90-91页 |
·工作展望 | 第91-92页 |
参考文献 | 第92-100页 |
致谢 | 第100-102页 |
研究成果及发表的学术论文 | 第102-104页 |
作者和导师简介 | 第104-105页 |
北京化工大学博士研究生学位论文答辩委员会决议书 | 第105-106页 |