首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本挖掘若干关键技术研究

摘要第1-6页
ABSTRACT第6-16页
第一章 绪论第16-24页
   ·文本挖掘技术第16-20页
     ·文本挖掘研究现状第16-17页
     ·文本挖掘热点难点问题第17-19页
     ·文本挖掘应用第19-20页
   ·文本聚类方法研究第20-22页
     ·文本聚类研究现状第21页
     ·文本聚类研究所关注的问题第21-22页
   ·本文的研究内容第22-23页
   ·本文的组织结构第23-24页
第二章 基于关联规则的文本建模方法研究第24-36页
   ·向量空间模型第24-26页
     ·特征项的选取和权重的计算第25页
     ·基于词的向量空间模型第25-26页
   ·向量空间模型的构建第26-30页
     ·中文文本数据建模第27-29页
     ·英文文本数据建模第29-30页
   ·基于关联规则的向量空间模型第30-33页
     ·向量空间模型存在的问题第30-31页
     ·向量空间模型的关联分析第31-32页
     ·构建向量空间模型的增量更新方法第32-33页
   ·实例第33-35页
   ·小结第35-36页
第三章 基于非负矩阵分解的文本聚类方法研究第36-52页
   ·非负矩阵分解方法研究第36-37页
     ·非负矩阵分解方法综述第36-37页
     ·非负矩阵分解的理论基础第37页
   ·非负矩阵分解算法理论分析第37-41页
     ·乘性更新算法第37-38页
     ·投影梯度算法第38页
     ·基于秩1的迭代算法(RRI)第38-39页
     ·关于FCM算法和NMF算法的讨论第39-40页
     ·关于迭代算法终止条件的讨论第40-41页
   ·基于矩阵变换的快速非负矩阵分解第41-45页
     ·算法推导第41-43页
     ·基于矩阵变换的交替最小平方算法第43-44页
     ·改进的TM-ALS算法第44-45页
     ·复杂度分析第45页
   ·文本聚类的评价方法第45-46页
     ·查准率、查全率和F测量值第45-46页
     ·silhouette值第46页
   ·实验仿真第46-51页
     ·随机非负矩阵第47-49页
     ·TanCorp数据集第49-50页
     ·Reuters数据集第50-51页
   ·小结第51-52页
第四章 核聚类方法研究第52-66页
   ·核函数基础知识第52-54页
     ·核函数理论第52-53页
     ·常用核函数第53-54页
   ·核聚类方法第54-59页
     ·核聚类算法(KCM)第54-55页
     ·模糊核聚类算法(FKCM)第55-56页
     ·改进的模糊核聚类算法(IFKCM)第56页
     ·实验仿真第56-59页
   ·基于语义核的局部自适应聚类算法研究第59-65页
     ·局部自适应算法(LAC)第60-61页
     ·基于高斯语义核的局部自适应聚类算法第61-62页
     ·实验仿真第62-65页
   ·小结第65-66页
第五章 基于NMF的层次聚类方法第66-80页
   ·层次聚类方法第66-68页
     ·凝聚层次聚类(HAC)方法第66-67页
     ·划分层次聚类(HPC)第67-68页
     ·划分和凝聚结合第68页
   ·基于NMF的划分层次聚类方法第68-70页
     ·聚类数目的确定第68-69页
     ·计算复杂度分析第69页
     ·基于特征-文档矩阵V进行底层聚类划分的层次聚类算法第69-70页
   ·基于NMF的混合划分凝聚层次聚类方法第70页
   ·仿真第70-75页
     ·随机数据矩阵仿真第71-73页
     ·TanCorp数据仿真第73-75页
   ·聚类表示方法第75-78页
     ·基于NMF的聚类表示方法第75-76页
     ·基于Testor理论的聚类表示第76-78页
   ·小结第78-80页
第六章 文本挖掘方法在科研信息领域的应用第80-90页
   ·基于文本挖掘技术的科研信息自动建议系统第80-81页
   ·系统设计第81-84页
     ·信息领域科技文献文本数据的特点第81-82页
     ·系统结构第82-83页
     ·开发环境第83-84页
   ·系统各模块功能第84-86页
     ·数据采集模块第84页
     ·科研文档数据预处理第84页
     ·文本建模第84-85页
     ·文本挖掘模块第85-86页
     ·建议生成、知识管理模块第86页
   ·辅助工具的开发第86-88页
     ·用户接口部分第86-87页
     ·中英文混合分词处理第87页
     ·科研文档建模工具第87-88页
   ·实例第88-89页
   ·小结第89-90页
第七章 结论与展望第90-92页
   ·结论第90-91页
   ·工作展望第91-92页
参考文献第92-100页
致谢第100-102页
研究成果及发表的学术论文第102-104页
作者和导师简介第104-105页
北京化工大学博士研究生学位论文答辩委员会决议书第105-106页

论文共106页,点击 下载论文
上一篇:基于模型的油气管道泄漏检测与定位方法研究
下一篇:可拓理论在过程工业中的应用研究