首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web文本挖掘技术研究及其实现

第一章 绪论第1-16页
 1.1 我们所期望的信息服务第7-9页
 1.2 WEB挖掘的起源第9页
 1.3 WEB挖掘的定义第9-10页
 1.4 WEB挖掘与WEB信息检索第10-11页
  1.4.1 Web信息检索的定义第10页
  1.4.2 两者的关系第10-11页
 1.5 WEB挖掘的研究方向第11-15页
  1.5.1 Web文本挖掘第12-14页
  1.5.2 Web结构挖掘第14页
  1.5.3 Web使用记录挖掘第14-15页
 1.6 本文的工作第15-16页
第二章 WEB文本挖掘系统的设计第16-20页
 2.1 WEB的数据模型第16页
 2.2 WEB文本挖掘方法第16-17页
 2.3 WEB文本挖掘系统的设计第17-20页
  2.3.1 系统组件第18-19页
  2.3.2 系统行为第19-20页
第三章 WEB文档采集器的设计与实现第20-29页
 3.1 HTTP简介第20-21页
 3.2 总体设计思想第21-25页
  3.2.1 搜集代理模块第22页
  3.2.2 收集控制模块第22-23页
  3.2.3 文档发现模块第23-25页
 3.3 主要的实现技术第25-28页
  3.3.1 数据结构第25-26页
  3.3.2 进程间的通信第26页
  3.3.3 Web抓取第26-28页
 3.4 小结第28-29页
第四章 聚类/分类算法概述第29-44页
 4.1 样本类型及相似性测度第29-32页
  4.1.1 样本类型第29-30页
  4.1.2 相似性测度第30-32页
 4.2 聚类算法介绍第32-40页
  4.2.1 聚类三步曲第32-34页
  4.2.2 几种常用的聚类策略第34-35页
  4.2.3 类的定义第35页
  4.2.4 聚类谱系图第35-36页
  4.2.5 系统聚类法第36-38页
  4.2.6 动态聚类法第38-40页
 4.3 分类算法介绍第40-44页
  4.3.1 判别分析第40-42页
  4.3.2 机器学习的思路第42-43页
  4.3.3 神经网络第43-44页
第五章 聚类/分类中的粒度原理第44-54页
 5.1 聚类中的粒度原理第44-47页
  5.1.1 信息料度第45页
  5.1.2 信息料度的形式化描述第45-46页
  5.1.3 不同料度世界的关系第46-47页
 5.2 分类中的粒度原理第47-49页
  5.2.1 聚类结果和先验知识的不协调第47-48页
  5.2.2 从料度的角度理解不协调性第48-49页
 5.3 统一在粒度框架下的聚类和分类第49-50页
 5.4 基于信息粒度原理的分类算法第50-52页
 5.5 小结第52-54页
第六章 文本聚类中权重计算的对偶性策略第54-65页
 6.1 文本的表示第54-57页
  6.1.1 务实的统计路线第54-56页
  6.1.2 文本的形式化表示第56-57页
 6.2 特征项的选取第57-58页
 6.3 权重计算中的对偶性策略第58-62页
 6.4 概念空间第62-64页
 6.5 概念空间在文本聚类中的应用第64页
 6.6小结第64-65页
第七章 总结与展望第65-67页
 7.1 总结第65页
 7.2 展望第65-67页
参考文献第67-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:Linux安全增强技术研究及实现
下一篇:基于宽带网的DVB接收系统的软件设计及其实现