首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网页去噪与特征提取算法的研究及实现

摘要第1-7页
Abstract第7-11页
第1章 绪论第11-14页
   ·课题研究的背景与意义第11页
   ·国内外研究现状第11-12页
   ·本文的研究内容第12页
   ·本文的组织结构第12-14页
第2章 网页去噪及特征提取技术第14-17页
   ·网页去噪技术第14-15页
     ·基于网页结构的去噪第14页
     ·基于模板的网页去噪第14-15页
     ·基于可视化信息的网页去噪第15页
   ·特征提取技术第15-17页
第3章 网页去噪方法第17-28页
   ·网页的结构分析第18-20页
   ·基于标题与结点词共现频率及文本间相似度的去噪方法第20-28页
     ·基本概念第20页
     ·算法描述第20-24页
     ·实验结果第24-28页
第4章 特征选择算法第28-43页
   ·常用的特征提取算法第28-29页
   ·基于RFD的特征提取算法改进第29-32页
     ·基于分段情况特征提取算法第29-32页
     ·基于绝对值情况特征提取算法第32页
   ·中文网页分类系统实现第32-35页
     ·中文网页分类系统模块第32-35页
     ·网页分类结果第35页
   ·网页分类样本及实验结果分析第35-43页
     ·训练集与测试集第35页
     ·分类测试第35-36页
     ·测试评价指标第36页
     ·实验说明第36-37页
     ·实验结果第37-43页
第5章 面向主题特征的爬虫系统的实现第43-53页
   ·爬虫的应用第43页
   ·爬虫性能评价指标第43页
   ·面向主题特征的爬虫系统的设计目标第43-44页
   ·设计关键点第44-48页
     ·队列第44页
     ·多线程第44-47页
     ·URL主题相关度判别第47页
     ·内容相关度判别第47-48页
     ·Robots协议第48页
   ·主题爬虫程序实现的关键部分第48-49页
     ·启动主题爬虫程序第49页
     ·队列管理的实现第49页
     ·多线程的实现第49页
   ·实验结果及分析第49-53页
总结与展望第53-54页
致谢第54-55页
参考文献第55-59页
攻读硕士学位期间发表的论文第59-60页

论文共60页,点击 下载论文
上一篇:TCP友好拥塞控制及其与AQM的综合研究
下一篇:嵌入式基于模型驱动验证及软件生产线的研究与实现