基于WWW的聚类引擎研究

中文摘要	第1-6页
英文摘要	第6-11页
1 绪论	第11-23页
1．1 研究背景	第11-12页
1．2 研究现状	第12-19页
1．2．1 Web信息检索简况	第12-13页
1．2．2 数据挖掘简况	第13-15页
1．2．3 搜索引擎简况	第15-18页
1．2．4 聚类简况	第18页
1．2．5 存在的主要问题	第18-19页
1．3 研究目的	第19-20页
1．4 研究内容	第20-21页
1．5 论文工作	第21页
1．6 论文结构	第21-23页
2 相关知识	第23-43页
2．1 向量空间模型	第23-25页
2．1．1 向量空间	第23-24页
2．1．2 文档表示	第24-25页
2．1．3 相关性计算	第25页
2．2 搜索引擎	第25-28页
2．2．1 搜索引擎的工作原理	第25-26页
2．2．2 搜索引擎的分类	第26-27页
2．2．3 搜索引擎结果排序	第27-28页
2．3 元搜索引擎	第28-31页
2．3．1 元搜索引擎的意义	第29页
2．3．2 元搜索引擎的体系结构	第29-30页
2．3．3 元搜索引擎的发展方向	第30-31页
2．3．4 元搜索引擎中的重新排序	第31页
2．4 聚类	第31-38页
2．4．1 聚类的概念	第31-32页
2．4．2 聚类算法	第32-34页
2．4．3 聚类算法失效	第34-38页
2．5 文档聚类	第38-40页
2．5．1 检索前聚类与检索后聚类	第38-39页
2．5．2 文档相似性矩阵	第39-40页
2．6 信息检索效果评价	第40-43页
2．6．1 准确率与覆盖率	第40-41页
2．6．2 浏览距离	第41-43页
3 基于Rough集理论的不完备数据分析	第43-52页
3．1 引言	第43-44页
3．2 Rough集理论	第44页
3．3 不完备数据分析算法	第44-47页
3．3．1 扩充差异矩阵	第44-46页
3．3．2 不完备数据分析算法	第46页
3．3．3 算法复杂性分析	第46-47页
3．4 实例	第47-48页
3．5 实验与比较	第48-51页
3．6 小结	第51-52页
4 关键词组提取	第52-74页
4．1 问题	第52-54页
4．2 基本思想	第54-58页
4．2．1 判断子字符串是否词组	第55-57页
4．2．2 判断子字符串是否关键	第57-58页
4．3 算法分析与设计	第58-70页
4．3．1 数据结构	第58-63页
4．3．2 算法分析及设计	第63-70页
4．4 实例	第70-74页
5 遗传聚类	第74-87页
5．1 引言	第74-75页
5．2 遗传算法	第75-79页
5．2．1 遗传算法基本概念	第75-76页
5．2．2 标准遗传算法结构	第76-77页
5．2．3 遗传算法运算算子	第77-79页
5．2．4 遗传算法存在的问题	第79页
5．3 一种聚类新方法	第79-85页
5．3．1 问题描述	第80页
5．3．2 基本思想	第80-81页
5．3．3 算法设计	第81-83页
5．3．4 算法分析	第83-84页
5．3．5 实验结果	第84-85页
5．4 实例	第85-87页
6 基于WWW的聚类引擎研究	第87-100页
6．1 设计	第87-94页
6．1．1 设计准则	第87页
6．1．2 系统结构	第87-88页
6．1．3 数据获取	第88-89页
6．1．4 数据清理	第89-91页
6．1．5 词组提取	第91页
6．1．6 确定标识	第91-92页
6．1．7 建聚类树	第92-93页
6．1．8 SOTC	第93-94页
6．2 实现	第94-100页
7 结束语	第100-102页
7．1 本文的总结	第100页
7．2 相关的研究	第100-101页
7．3 进一步的研究	第101-102页
致谢	第102-103页
参考文献	第103-112页
攻读博士学位期间参加的科研和发表的论文	第112-113页