基于web的中文文本挖掘研究
摘要 | 第1-4页 |
Abstract | 第4-7页 |
前言 | 第7-14页 |
第一章 数据挖掘和web数据挖掘 | 第14-19页 |
·数据挖掘及其研究现状 | 第14-15页 |
·web数据挖掘的起源和定义 | 第15-16页 |
·web数据挖掘的起源 | 第15页 |
·web数据挖掘的定义 | 第15-16页 |
·web数据挖掘与web信息检索 | 第16页 |
·web信息检索的定义 | 第16页 |
·两者的关系 | 第16页 |
·web数据挖掘的分类 | 第16-17页 |
·web文本挖掘 | 第17页 |
·本次毕业设计进行的工作 | 第17-19页 |
第二章 web文本挖掘系统的设计 | 第19-22页 |
·web的数据模型 | 第19页 |
·web文本挖掘方法 | 第19-20页 |
·文本挖掘的处理过程 | 第20页 |
·系统模块划分 | 第20-22页 |
第三章 分类/聚类算法概述 | 第22-39页 |
·类及类间距离的定义 | 第22-25页 |
·类的定义 | 第22-23页 |
·类间距离的定义 | 第23-25页 |
·聚类算法介绍 | 第25-31页 |
·聚类步骤 | 第25-27页 |
·常用聚类算法 | 第27-29页 |
·基于自组织神经网络的聚类分析 | 第29-31页 |
·分类算法介绍 | 第31-39页 |
·常用分类算法 | 第31-32页 |
·基于神经网络的分类算法 | 第32-39页 |
第四章 web文本挖掘系统的详细设计 | 第39-46页 |
·网页信息分析 | 第39-41页 |
·网上信息的表示 | 第39页 |
·网页的结构分析 | 第39-40页 |
·网页控制符分析 | 第40页 |
·网页信息的提取流程 | 第40-41页 |
·HTML控制符号处理 | 第41页 |
·文档预处理 | 第41-44页 |
·中文词切分 | 第41-42页 |
·特征表示和特征提取 | 第42-43页 |
·权值计算 | 第43页 |
·特征向量的缩减(向量空间模型VSM) | 第43-44页 |
·分类算法选择 | 第44页 |
·聚类算法选择 | 第44页 |
·开发环境与开发工具 | 第44-45页 |
·系统开发环境 | 第44页 |
·SqlServer2000简介 | 第44-45页 |
·Delphi6.0简介 | 第45页 |
·系统实验及结果分析 | 第45-46页 |
第五章 文本挖掘的应用 | 第46-49页 |
·基于STCS的新型信息搜索引擎 | 第46-47页 |
·文本挖掘器TextMiner | 第47-48页 |
·小结 | 第48-49页 |
结论 | 第49-50页 |
致谢 | 第50-51页 |
攻读硕士学位期间发表的论文 | 第51-52页 |
参考文献 | 第52-53页 |