首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

专题型网页搜集器关键算法的研究及实现

摘要第1-3页
ABSTRACT第3-4页
目录第4-6页
第一章 引言第6-12页
   ·研究背景第6-10页
     ·面向主题的搜集技术第7-8页
     ·国内外发展状况第8-10页
   ·论文的工作第10-12页
     ·论文的研究工作第10-11页
     ·论文内容概述第11-12页
第二章 网页预处理及特征提取第12-19页
   ·网页预处理第12-15页
     ·网页信息提取第13-14页
     ·文本分词第14-15页
   ·网页特征提取及权重计算第15-17页
   ·文档表示模型-VSM模型第17-19页
第三章 基于DDBCUR聚类算法的网页过滤第19-33页
   ·聚类中的数据类型第19-21页
   ·主要聚类方法第21-22页
   ·基于动态密度的层次聚类算法第22-29页
     ·层次聚类方法第22-23页
     ·密度聚类方法第23-24页
     ·基于动态密度的层次聚类算法(DDBCUR)第24-29页
   ·基于聚类模型的网页过滤第29-33页
第四章 基于增量学习的链接排序算法第33-40页
   ·基于链接结构的链接相关性估计第33-36页
     ·利用已访问的父网页估计链接相关性第34页
     ·利用已访问的兄弟链接估计链接相关性第34-36页
     ·相关性合并第36页
   ·基于链接文本的链接相关性估计第36-38页
     ·利用链接文本估计第36-37页
     ·利用链接周围文本(Anchor文本)估计第37页
     ·利用搜索结果增量学习第37-38页
   ·基于链接结构的链接排序第38-40页
第五章 系统设计与实现第40-47页
   ·系统总体设计第40-41页
   ·数据库结构设计第41-42页
   ·网页采集模块第42-44页
     ·网页采集子模块第43-44页
     ·信息提取子模块第44页
   ·页过滤模块第44-45页
     ·样本聚类子模块第44-45页
     ·网页过滤子模块第45页
   ·链接分析模块第45-47页
第六章 实验与评价第47-55页
   ·网页聚类实验第47-51页
     ·聚类训练实验——类模型生成第47-49页
     ·类训练——类模型应用第49-50页
     ·评价第50-51页
   ·系统整体性能实验第51-55页
     ·实验内容第51-52页
     ·实验结果与评价第52-55页
第七章 总结与展望第55-57页
参考文献第57-61页
致谢第61-62页
本人简历第62页

论文共62页,点击 下载论文
上一篇:基于PE文件格式的信息隐藏技术研究
下一篇:上犹县供电公司提升赢利能力初探