首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

博客自动发现方法

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-17页
   ·课题背景第10页
   ·课题目的及意义第10-11页
   ·国内外相关技术发展现状第11-15页
     ·博客相关研究工作第11-14页
     ·博客主页识别相关研究第14-15页
   ·本文的主要研究内容第15-17页
     ·本文内容第15页
     ·本文的组织第15-17页
第2章 相关技术第17-30页
   ·引言第17页
   ·网络爬虫第17-19页
     ·传统网络爬虫基本原理第17-18页
     ·传统网络爬虫的工作流程第18页
     ·传统网络爬虫的网页抓取策略第18-19页
   ·聚焦网络爬虫第19-20页
   ·Ajax技术第20-25页
     ·Ajax技术基础第20页
     ·XMLHttpRequest组件第20-22页
     ·Ajax工作原理及分析第22-23页
     ·Ajax技术应用分析第23-25页
   ·文本分类相关技术第25-29页
     ·文本分类定义第25页
     ·文本分类关键技术第25-29页
   ·本章小结第29-30页
第3章 基于Ajax解析的博客发现系统第30-37页
   ·引言第30页
   ·博客发现系统第30-36页
     ·系统总体流程第30-32页
     ·URL服务模块第32-33页
     ·网页采集模块第33页
     ·HTML及javascript解析模块第33-35页
     ·DOM树解析模块第35-36页
   ·本章小结第36-37页
第4章 基于文本分类的博客主页识别算法第37-49页
   ·引言第37页
   ·博客主页特点及其识别算法实现第37-48页
     ·博客主页特点第37-40页
     ·算法总体结构第40-42页
     ·博客主页特征提取及特征选择第42-45页
     ·博客主页识别算法平台——WEKA第45-46页
     ·分类器生成第46-48页
   ·本章小结第48-49页
第5章 系统与算法性能评测第49-62页
   ·引言第49页
   ·实验评测第49-52页
     ·实验环境第49-50页
     ·实验数据第50-51页
     ·评测标准第51-52页
   ·博客发现系统实验结果第52-55页
     ·Ajax博客网站的测试第52页
     ·系统发现能力的测试第52-55页
   ·博客主页识别算法实验第55-61页
     ·分类体系实验结果第55-57页
     ·候选特征实验结果第57-58页
     ·各个分类模型下实验结果第58-60页
     ·实验结果分析第60-61页
   ·本章小结第61-62页
结论第62-63页
参考文献第63-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:基于朴素贝叶斯与SVM的垃圾邮件检测系统的设计与实现
下一篇:基于在线学习算法的恶意网页检测系统