首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于特征短语的网页在线聚类方法

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-21页
   ·课题背景第9页
   ·课题目的及意义第9-12页
   ·国内外相关技术发展现状第12-20页
     ·信息检索研究现状第12-13页
     ·搜索引擎研究现状第13-16页
     ·网页在线聚类技术研究现状第16-20页
   ·本文主要内容第20-21页
第2章 网页聚类方法介绍第21-34页
   ·聚类概述第21-27页
     ·基本概念第21-23页
     ·向量空间模型和相似性度量第23页
     ·聚类算法第23-27页
   ·网页聚类第27-33页
     ·后缀树聚类第27-30页
       ·后缀树定义第27-28页
       ·构建后缀树第28-29页
       ·抽取短语第29-30页
     ·有向图聚类第30-33页
       ·数据模型第30-31页
       ·有向图的构造第31页
       ·高频短语识别第31-32页
       ·短语扩展与聚类第32-33页
   ·本章小结第33-34页
第3章 基于特征短语的网页在线聚类算法第34-48页
   ·算法基本结构第34-35页
   ·网页信息抽取与内容表示第35-37页
     ·网页正文信息抽取第36页
     ·网页标记信息抽取第36-37页
     ·网页内容表示第37页
   ·特征短语提取第37-44页
     ·基于后缀数组的特征短语提取方法第38-40页
     ·特征短语抽取第40-42页
     ·特征短语中重复子串的过滤第42-44页
   ·网页在线聚类第44-47页
     ·算法流程第44页
     ·确定基类第44-46页
     ·类别合并第46页
     ·类别排序第46-47页
   ·本章小结第47-48页
第4章 系统实现与评测第48-66页
   ·引言第48页
   ·网页聚类系统的实现第48-51页
   ·聚类缓存的设计与实现第51-56页
     ·web缓存技术第51-52页
     ·缓存实现策略第52-53页
     ·缓存替换算法第53-56页
   ·实验环境第56页
   ·实验结果与分析第56-65页
     ·评价标准第56-58页
     ·实验方案第58-59页
     ·实验分析第59-65页
   ·下一步研究工作第65页
   ·本章小结第65-66页
结论第66-67页
参考文献第67-71页
攻读学位期间发表的学术论文第71-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:主题驱动的Blog社区发现技术研究
下一篇:基于snort的混合式入侵检测系统的研究与实现