首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于近似网页聚类算法的Web文本数据挖掘技术的研究与应用

摘要第1-8页
Abstract第8-9页
第1章 绪论第9-15页
 1.1 Web数据挖掘第9-10页
 1.2 Web数据挖掘与Web信息检索第10-12页
 1.3 基于XML的Web数据挖掘第12-13页
 1.4 选题背景及意义第13页
 1.5 本文的组织结构第13-15页
第2章 Web数据挖掘第15-27页
 2.1 概述第15-16页
 2.2 Web数据挖掘技术第16-18页
  2.2.1 Web数据挖掘的基本原理第16-17页
  2.2.2 结构挖掘第17-18页
  2.2.3 Web使用记录挖掘第18页
  2.2.4 内容挖掘第18页
 2.3 Web文本数据挖掘第18-24页
  2.3.1 概述第18-19页
  2.3.2 Web文本挖掘的工作流程第19页
  2.3.3 特征提取第19-21页
  2.3.4 文本分类和文本聚类第21-23页
  2.3.5 模型质量的评价第23-24页
 2.4 XML语言及其在Web数据挖掘中的应用第24-27页
第3章 搜索引擎技术第27-33页
 3.1 概述第27-28页
  3.1.1 概念第27页
  3.1.2 分类第27-28页
  3.1.3 主要搜索引擎第28页
 3.2 搜索引擎的工作原理第28-29页
 3.3 搜索引擎的工作流程第29页
 3.4 搜索引擎的关键技术——网络蜘蛛第29-32页
  3.4.1 原理描述第29-30页
  3.4.2 算法描述第30-32页
 3.5 搜索引擎的发展现状及存在的问题第32-33页
第4章 一种基于近似网页聚类的Web文本数据挖掘技术第33-55页
 4.1 工作流程第33-34页
 4.2 生成分词词典组第34-36页
  4.2.1 模糊聚类分析第34页
  4.2.2 模糊等价关系与聚类分析第34-35页
  4.2.3 基于模糊相似关系的模式分类第35页
  4.2.4 基于模糊聚类分析的词汇聚类第35-36页
 4.3 数据预处理第36-45页
  4.3.1 数据源第36页
  4.3.2 Web文本信息提取第36-39页
  4.3.3 去噪第39页
  4.3.4 分词第39页
  4.3.5 特征提取第39-41页
  4.3.6 文本表示第41-43页
  4.3.7 词频统计第43页
  4.3.8 降维第43-45页
 4.4 重复网页检测第45-47页
  4.4.1 算法基础第45页
  4.4.2 算法描述第45-47页
  4.4.3 算法分析第47页
 4.5 近似网页聚类第47-51页
  4.5.1 算法基础第47-48页
  4.5.2 算法描述第48-49页
  4.5.3 算法分析及评测第49-50页
  4.5.4 实验结果第50-51页
 4.6 网页簇排序第51-53页
  4.6.1 算法思想第51页
  4.6.2 算法描述第51-53页
 4.7 应用特点第53-54页
 4.8 小结第54-55页
第5章 应用实例——TW-OA办公自动化系统第55-72页
 5.1 系统架构第56页
 5.2 用户体验层第56-57页
  5.2.1 主要功能第56页
  5.2.2 采用的主要技术第56-57页
 5.3 应用服务第57-59页
  5.3.1 个人信息管理第57页
  5.3.2 交流和协作管理第57页
  5.3.3 视频会议管理第57页
  5.3.4 网上学习和培训第57-58页
  5.3.5 公文管理第58页
  5.3.6 办公事务管理第58页
  5.3.7 电子公章管理第58-59页
  5.3.8 文档管理第59页
  5.3.9 合同管理第59页
  5.3.10 信息发布管理第59页
 5.4 基础服务第59-61页
  5.4.1 用户管理和个性化服务第59-60页
  5.4.2 工作流服务第60页
  5.4.3 流程表单设计和数据绑定第60页
  5.4.4 流程设计和自定义工作流第60-61页
  5.4.5 流程角色和用户权限管理第61页
  5.4.6 流程跟踪、监控、查询和统计第61页
  5.4.7 文档管理服务第61页
  5.4.8 跟踪管理服务第61页
  5.4.9 计划管理服务第61页
  5.4.10 智能搜索第61页
 5.5 智能搜索子系统第61-70页
  5.5.1 系统结构第61-62页
  5.5.2 系统工作流程第62-63页
  5.5.3 主要功能模块第63-70页
 5.6 系统特色第70-71页
 5.7 系统运行情况第71-72页
结论第72-74页
参考文献第74-78页
致谢第78-79页
附录A(攻读学位期间发表的论文)第79-80页
附录B(攻读学位期间科研)第80页

论文共80页,点击 下载论文
上一篇:品牌关系:美康强化服务品牌建设新模式
下一篇:水库库岸滑坡速度及其涌浪灾害研究