基于社团发现的Blog信息收集原型系统的研究

表目录	第1-8页
图目录	第8-10页
摘要	第10-11页
ABSTRACT	第11-12页
第一章绪论	第12-17页
·研究背景和意义	第12-13页
·当前研究现状	第13-15页
·研究内容	第15页
·论文结构安排	第15-17页
第二章相关概念介绍	第17-21页
·Blog 概述	第17-18页
·Blog 的概念	第17页
·Blog 的基本特征和功能要素	第17页
·Blog 的发展现状	第17-18页
·爬虫工具介绍	第18-19页
·爬虫工作原理	第18-19页
·爬虫设计规范	第19页
·Robots 协议介绍	第19页
·SiteMap 介绍	第19页
·文本挖掘	第19-20页
·文本挖掘的概念	第19页
·文本挖掘种类	第19-20页
·复杂网络	第20-21页
第三章 Blog 信息挖掘原型系统总体设计	第21-25页
·主要功能模块的需求分析	第21页
·系统总体框架	第21-23页
·系统主要功能	第23-24页
·工作重点与难点	第24页
·小结	第24-25页
第四章数据收集和预处理模块设计与实现	第25-38页
·Blog 的特点	第25-26页
·Blog 页面的结构	第25-26页
·HTML 中的超链接	第26页
·Blog 页面的一般结构	第26页
·Blog 爬虫设计	第26-33页
·Blog 爬虫界面	第33页
·信息抽取和预处理	第33-37页
·小结	第37-38页
第五章文本分类模块设计与实现	第38-46页
·文本预处理	第38页
·特征提取	第38-41页
·分词词典的设计	第38-39页
·中文分词	第39-40页
·特征选择算法	第40-41页
·文本中特征词的统计	第41-43页
·计算文章类别	第43-44页
·话题的时间趋势分布	第44-45页
·小结	第45-46页
第六章 Blog 关系网络分析	第46-61页
·Blog 主题讨论网络特征分析	第46-49页
·Blog 的网络化描述	第46-47页
·建立模型	第47-48页
·Blog 网络的整体结构特性	第48-49页
·Blog 关系网络的社团挖掘	第49-55页
·社团挖掘方法	第50页
·Blog 网络社团挖掘算法设计与实现	第50-54页
·社团结构发现算法的精度验证	第54-55页
·Blog 关系网络的核心结点查找	第55-57页
·Blog 网络的中心化	第55页
·核心查找算法	第55-56页
·核心查找算法设计与实现	第56-57页
·核心结点查找算法的有效性验证	第57页
·Blog 网络图形化显示	第57-60页
·Prefuse 功能介绍	第57-58页
·软件框架的搭建与过程举例	第58-59页
·Blog 网络图形化显示	第59-60页
·小结	第60-61页
第七章测试与结论	第61-68页
·测试环境	第61页
·数据收集模块测试	第61-63页
·爬虫对页面链接的发现能力	第61-63页
·爬虫的执行效率评价	第63页
·文本过滤模块的测试	第63-65页
·文本分类效果测试	第63-64页
·文本分类效率测试	第64-65页
·网络分析模块的测试	第65-66页
·随机生成网络测试	第65-66页
·实际测试	第66页
·小结	第66-68页
结束语	第68-70页
参考文献	第70-74页
作者简历攻读硕士学位期间完成的主要工作	第74-75页
致谢	第75页