首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

一种改进的基于概念的中文WEB文本聚类算法的研究

摘要第1-3页
ABSTRACT第3-10页
第一章 绪论第10-16页
 1.1 研究课题的来源、目的和意义第10-14页
  1.1.1 Web 文本挖掘的来源和背景第10页
  1.1.2 Web 文本挖掘的发展和主要技术第10-12页
  1.1.3 国内外Web 文本挖掘的主要产品第12-14页
 1.2 本文工作第14-16页
  1.2.1 研究目标第14页
  1.2.2 研究内容第14-15页
  1.2.3 论文组织第15-16页
第二章 WEB 文本挖掘系统的关键技术第16-24页
 2.1 WEB 文本挖掘系统的设计第16-20页
  2.1.1 Web 文本挖掘的过程和系统框架的设计第16-17页
  2.1.2 关键系统子模块的功能实现第17-20页
   2.1.2.1 中文网页采集器第17-18页
   2.1.2.2 预处理器第18-19页
   2.1.2.3 知识挖掘子系统(聚类/分类/文本分析)第19-20页
   2.1.2.4 知识模式评估第20页
 2.2 文本聚类技术的研究第20-23页
  2.2.1 Web 文本聚类与传统的聚类分析的不同点第20-21页
  2.2.2 常用的Web 文本聚类技术第21-23页
   2.2.2.1 层次凝聚法第21页
   2.2.2.2 平面划分法第21-22页
   2.2.2.3 简单的贝叶斯文本聚类算法第22页
   2.2.2.4 基于SOM 网络的文本聚类算法第22-23页
 2.3 小结第23-24页
第三章 一种基于知网的中文文本概念聚类算法的实现第24-37页
 3.1 问题概述第24-25页
  3.1.1 中文文本聚类第24页
  3.1.2 基于概念的文本聚类的研究现状第24-25页
 3.2 一种基于概念的中文文本聚类算法第25-32页
  3.2.1 特征集预处理第25-26页
  3.2.2 引入HowNet 作为算法的背景知识第26-30页
   3.2.2.1 HowNet 知网系统第26-27页
   3.2.2.2 概念词典的建立第27-29页
   3.2.2.2 概念消歧策略第29-30页
  3.2.3 概念集向量空间的建立第30-31页
   3.2.3.1 概念映射第30页
   3.2.3.2 概念集向量描述第30-31页
  3.2.4 基于BiSec-k-Means 的聚类分析算法第31页
  3.2.5 类簇说明的标注抽取第31-32页
 3.3 实验分析第32-36页
  3.3.1 聚类评估标准第32-34页
   3.3.3.1 Entropy 标准第33页
   3.3.3.2 Precision 标准第33-34页
  3.3.2 聚类质量分析第34-36页
   3.3.2.1 实验数据第34页
   3.3.2.2 聚类结果分析第34-36页
 3.4 小结第36-37页
第四章 一种改进的动态的中文文本概念聚类算法第37-46页
 4.1 问题概述第37-38页
  4.1.1 基于知网的中文文本聚类算法的分析第37页
  4.1.2 一种动态的中文文本概念聚类算法的提出第37-38页
 4.2 粗糙集理论的相关背景和概念第38-40页
  4.2.1 背景介绍第38页
  4.2.2 相关概念第38-40页
 4.3 一种动态的中文文本概念聚类算法第40-43页
  4.3.1 预处理过程第40-41页
  4.3.2 对部分概念集进行粗糙集属性选取第41-42页
  4.3.3 二次聚类学习第42-43页
 4.4 实验分析第43-44页
 4.5 小结第44-46页
第五章 中文文本聚类类簇的二次聚类分析第46-57页
 5.1 问题概述第46-47页
  5.1.1 非概念聚类分析技术应用在文本聚类中的特点分析第46页
  5.1.2 形式概念分析技术第46-47页
 5.2 形式概念分析相关概念和算法第47-52页
  5.2.1 背景和相关概念第47-49页
  5.2.2 概念格的构造算法的主要思想第49-52页
   5.2.2.1 概念格的批处理生成算法第50-51页
   5.2.2.2 概念格的渐进式生成算法第51-52页
 5.3 文本类簇的形式概念分析第52-56页
  5.3.1 预处理第52页
  5.3.2 概念格的构造第52-54页
  5.3.3 结果分析第54-56页
 5.4 本章小结第56-57页
第六章 总结与展望第57-59页
 6.1 本文的主要研究成果和创新点第57页
 6.2 存在的问题和对未来工作的展望第57-59页
参考文献第59-61页
致谢语第61-62页
个人简历,在学期间研究工作及发表论文第62页
 个人简历第62页
 在学期间研究工作第62页
 硕士期间所完成发表的论文第62页

论文共62页,点击 下载论文
上一篇:肌酸激酶与急性一氧化碳中毒程度关系的临床研究
下一篇:当归提取物对血管内皮细胞、成纤维细胞增殖、凋亡和胶原合成的影响