首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

WEB文本挖掘系统

摘要第1-3页
ABSTRACT第3-6页
第一章 引言第6-9页
   ·研究背景和意义第6-7页
   ·本文的研究内容第7页
   ·本文的组织结构第7-9页
第二章 WEB挖掘的定义第9-13页
   ·WEB挖掘的定义第9-10页
   ·WEB挖掘系统和搜索引擎的异同第10-11页
   ·国外的研究现状第11-13页
第三章 网页采集第13-19页
   ·WEB采集的系统实现第13-16页
   ·PageRank方法第16页
   ·HITS算法第16-19页
第四章 网页净化第19-34页
   ·基于标签树的净化方法第19-20页
   ·基于ST树的净化方法第20-21页
   ·基于VIPS的净化算法第21-25页
   ·基于dom树的网页净化方法第25-34页
第五章 向量空间模型的建立第34-37页
   ·向量空间模型第34-35页
   ·向量维数压缩第35-37页
第六章 中文分词和关键词的获取第37-42页
   ·基于字典、词库匹配的分词方法第37-38页
   ·基于词的频度统计的分词方法第38页
   ·基于知识理解的分词方法第38-39页
   ·专有名词的获取第39-40页
   ·中文分词面临的问题第40-42页
第七章 WEB文本聚类第42-46页
   ·K平均聚类算法(K-mean)第42-43页
   ·SOM聚类算法第43-44页
   ·一种新的聚类算法,投影聚类算法。第44-46页
第八章 WEB挖掘系统的系统结构第46-54页
   ·数据采集模块第47页
   ·数据预处理模块第47-50页
   ·网页净化模块第50-51页
   ·数据库存储模块第51-52页
   ·特征量抽取和缩减模块第52页
   ·WEB聚类模块第52-54页
第九章 总结和展望第54-55页
参考文献第55-61页
附录2第61-92页
致谢第92-93页

论文共93页,点击 下载论文
上一篇:通用空间地形数据采集处理若干关键技术的研究与应用
下一篇:基于RMI技术的分布式数据挖掘平台设计与研究