基于特征短语的网页在线聚类方法

摘要	第1-5页
Abstract	第5-9页
第1章绪论	第9-21页
·课题背景	第9页
·课题目的及意义	第9-12页
·国内外相关技术发展现状	第12-20页
·信息检索研究现状	第12-13页
·搜索引擎研究现状	第13-16页
·网页在线聚类技术研究现状	第16-20页
·本文主要内容	第20-21页
第2章网页聚类方法介绍	第21-34页
·聚类概述	第21-27页
·基本概念	第21-23页
·向量空间模型和相似性度量	第23页
·聚类算法	第23-27页
·网页聚类	第27-33页
·后缀树聚类	第27-30页
·后缀树定义	第27-28页
·构建后缀树	第28-29页
·抽取短语	第29-30页
·有向图聚类	第30-33页
·数据模型	第30-31页
·有向图的构造	第31页
·高频短语识别	第31-32页
·短语扩展与聚类	第32-33页
·本章小结	第33-34页
第3章基于特征短语的网页在线聚类算法	第34-48页
·算法基本结构	第34-35页
·网页信息抽取与内容表示	第35-37页
·网页正文信息抽取	第36页
·网页标记信息抽取	第36-37页
·网页内容表示	第37页
·特征短语提取	第37-44页
·基于后缀数组的特征短语提取方法	第38-40页
·特征短语抽取	第40-42页
·特征短语中重复子串的过滤	第42-44页
·网页在线聚类	第44-47页
·算法流程	第44页
·确定基类	第44-46页
·类别合并	第46页
·类别排序	第46-47页
·本章小结	第47-48页
第4章系统实现与评测	第48-66页
·引言	第48页
·网页聚类系统的实现	第48-51页
·聚类缓存的设计与实现	第51-56页
·web缓存技术	第51-52页
·缓存实现策略	第52-53页
·缓存替换算法	第53-56页
·实验环境	第56页
·实验结果与分析	第56-65页
·评价标准	第56-58页
·实验方案	第58-59页
·实验分析	第59-65页
·下一步研究工作	第65页
·本章小结	第65-66页
结论	第66-67页
参考文献	第67-71页
攻读学位期间发表的学术论文	第71-73页
致谢	第73页