博客自动发现方法

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-17页
·课题背景	第10页
·课题目的及意义	第10-11页
·国内外相关技术发展现状	第11-15页
·博客相关研究工作	第11-14页
·博客主页识别相关研究	第14-15页
·本文的主要研究内容	第15-17页
·本文内容	第15页
·本文的组织	第15-17页
第2章相关技术	第17-30页
·引言	第17页
·网络爬虫	第17-19页
·传统网络爬虫基本原理	第17-18页
·传统网络爬虫的工作流程	第18页
·传统网络爬虫的网页抓取策略	第18-19页
·聚焦网络爬虫	第19-20页
·Ajax技术	第20-25页
·Ajax技术基础	第20页
·XMLHttpRequest组件	第20-22页
·Ajax工作原理及分析	第22-23页
·Ajax技术应用分析	第23-25页
·文本分类相关技术	第25-29页
·文本分类定义	第25页
·文本分类关键技术	第25-29页
·本章小结	第29-30页
第3章基于Ajax解析的博客发现系统	第30-37页
·引言	第30页
·博客发现系统	第30-36页
·系统总体流程	第30-32页
·URL服务模块	第32-33页
·网页采集模块	第33页
·HTML及javascript解析模块	第33-35页
·DOM树解析模块	第35-36页
·本章小结	第36-37页
第4章基于文本分类的博客主页识别算法	第37-49页
·引言	第37页
·博客主页特点及其识别算法实现	第37-48页
·博客主页特点	第37-40页
·算法总体结构	第40-42页
·博客主页特征提取及特征选择	第42-45页
·博客主页识别算法平台——WEKA	第45-46页
·分类器生成	第46-48页
·本章小结	第48-49页
第5章系统与算法性能评测	第49-62页
·引言	第49页
·实验评测	第49-52页
·实验环境	第49-50页
·实验数据	第50-51页
·评测标准	第51-52页
·博客发现系统实验结果	第52-55页
·Ajax博客网站的测试	第52页
·系统发现能力的测试	第52-55页
·博客主页识别算法实验	第55-61页
·分类体系实验结果	第55-57页
·候选特征实验结果	第57-58页
·各个分类模型下实验结果	第58-60页
·实验结果分析	第60-61页
·本章小结	第61-62页
结论	第62-63页
参考文献	第63-68页
致谢	第68页