首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于WWW的聚类引擎研究

中文摘要第1-6页
英文摘要第6-11页
1 绪论第11-23页
 1.1 研究背景第11-12页
 1.2 研究现状第12-19页
  1.2.1 Web信息检索简况第12-13页
  1.2.2 数据挖掘简况第13-15页
  1.2.3 搜索引擎简况第15-18页
  1.2.4 聚类简况第18页
  1.2.5 存在的主要问题第18-19页
 1.3 研究目的第19-20页
 1.4 研究内容第20-21页
 1.5 论文工作第21页
 1.6 论文结构第21-23页
2 相关知识第23-43页
 2.1 向量空间模型第23-25页
  2.1.1 向量空间第23-24页
  2.1.2 文档表示第24-25页
  2.1.3 相关性计算第25页
 2.2 搜索引擎第25-28页
  2.2.1 搜索引擎的工作原理第25-26页
  2.2.2 搜索引擎的分类第26-27页
  2.2.3 搜索引擎结果排序第27-28页
 2.3 元搜索引擎第28-31页
  2.3.1 元搜索引擎的意义第29页
  2.3.2 元搜索引擎的体系结构第29-30页
  2.3.3 元搜索引擎的发展方向第30-31页
  2.3.4 元搜索引擎中的重新排序第31页
 2.4 聚类第31-38页
  2.4.1 聚类的概念第31-32页
  2.4.2 聚类算法第32-34页
  2.4.3 聚类算法失效第34-38页
 2.5 文档聚类第38-40页
  2.5.1 检索前聚类与检索后聚类第38-39页
  2.5.2 文档相似性矩阵第39-40页
 2.6 信息检索效果评价第40-43页
  2.6.1 准确率与覆盖率第40-41页
  2.6.2 浏览距离第41-43页
3 基于Rough集理论的不完备数据分析第43-52页
 3.1 引言第43-44页
 3.2 Rough集理论第44页
 3.3 不完备数据分析算法第44-47页
  3.3.1 扩充差异矩阵第44-46页
  3.3.2 不完备数据分析算法第46页
  3.3.3 算法复杂性分析第46-47页
 3.4 实例第47-48页
 3.5 实验与比较第48-51页
 3.6 小结第51-52页
4 关键词组提取第52-74页
 4.1 问题第52-54页
 4.2 基本思想第54-58页
  4.2.1 判断子字符串是否词组第55-57页
  4.2.2 判断子字符串是否关键第57-58页
 4.3 算法分析与设计第58-70页
  4.3.1 数据结构第58-63页
  4.3.2 算法分析及设计第63-70页
 4.4 实例第70-74页
5 遗传聚类第74-87页
 5.1 引言第74-75页
 5.2 遗传算法第75-79页
  5.2.1 遗传算法基本概念第75-76页
  5.2.2 标准遗传算法结构第76-77页
  5.2.3 遗传算法运算算子第77-79页
  5.2.4 遗传算法存在的问题第79页
 5.3 一种聚类新方法第79-85页
  5.3.1 问题描述第80页
  5.3.2 基本思想第80-81页
  5.3.3 算法设计第81-83页
  5.3.4 算法分析第83-84页
  5.3.5 实验结果第84-85页
 5.4 实例第85-87页
6 基于WWW的聚类引擎研究第87-100页
 6.1 设计第87-94页
  6.1.1 设计准则第87页
  6.1.2 系统结构第87-88页
  6.1.3 数据获取第88-89页
  6.1.4 数据清理第89-91页
  6.1.5 词组提取第91页
  6.1.6 确定标识第91-92页
  6.1.7 建聚类树第92-93页
  6.1.8 SOTC第93-94页
 6.2 实现第94-100页
7 结束语第100-102页
 7.1 本文的总结第100页
 7.2 相关的研究第100-101页
 7.3 进一步的研究第101-102页
致谢第102-103页
参考文献第103-112页
攻读博士学位期间参加的科研和发表的论文第112-113页

论文共113页,点击 下载论文
上一篇:基于粗集理论的KDD技术研究
下一篇:VO2薄膜制备及其应用性能基础研究