基于搜索词的网页结果聚类研究与应用

摘要	第1-6页
Abstract	第6-10页
第一章绪论	第10-14页
·本文的研究背景及研究意义	第10-11页
·国内外研究现状及应用	第11-13页
·研究现状	第11-12页
·存在的问题	第12-13页
·本文的主要内容及组织结构	第13-14页
第二章 Web文本挖掘概述	第14-29页
·Web文本挖掘的概念及特点	第14-15页
·Web文本挖掘的概念	第14页
·Web文本的特点	第14-15页
·文本挖掘的特点	第15页
·Web文本挖掘的一般过程	第15-16页
·Web文本挖掘方法	第16-19页
·文本分类	第16-17页
·文本聚类	第17页
·关联分析	第17-18页
·文本总结	第18页
·分布分析和趋势预测	第18-19页
·Web文本获取	第19页
·Web文本挖掘预处理	第19-28页
·Web正文提取	第20页
·向量空间模型	第20-21页
·中文分词	第21-23页
·特征项选取	第23-26页
·特征项权重	第26-28页
·本章小结	第28-29页
第三章 Web文本聚类介绍	第29-41页
·Web文本聚类	第29-30页
·Web文本聚类的概念	第29页
·Web文本聚类的过程	第29-30页
·文本相似度的计算	第30-32页
·Web文本聚类算法	第32-35页
·基于划分的方法	第33-34页
·基于层次的方法	第34页
·基于模型的方法	第34-35页
·SOM神经网络	第35页
·基于网格的方法	第35页
·Web文本聚类结果质量评估	第35-37页
·现有的网页聚类系统	第37-40页
·Scatter/Gather	第37页
·Carrot	第37-38页
·SHOC,LINGO	第38页
·SnakeT	第38-39页
·Vivisimo	第39-40页
·本章小结	第40-41页
第四章聚类改进算法	第41-52页
·CBC聚类算法	第41-44页
·算法基本思想	第42页
·算法描述及分析	第42-44页
·加入搜索词的聚类改进算法	第44-51页
·改进的特征词权重计算方法	第44-45页
·改进的特征向量相似度计算方法	第45-46页
·加入搜索词的改进聚类中心确定算法	第46-49页
·改进算法分析及实验	第49-51页
·本章小结	第51-52页
第五章基于搜索词的中文Web聚类系统	第52-62页
·系统开发平台与开发环境	第52页
·系统总体结构及功能模块	第52-54页
·测试数据集	第54-55页
·系统运行方法及步骤	第55-61页
·本章小结	第61-62页
结论与展望	第62-64页
参考文献	第64-67页
攻读硕士学位期间取得的研究成果	第67-68页
致谢	第68页