首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于社团发现的Blog信息收集原型系统的研究

表目录第1-8页
图目录第8-10页
摘要第10-11页
ABSTRACT第11-12页
第一章 绪论第12-17页
   ·研究背景和意义第12-13页
   ·当前研究现状第13-15页
   ·研究内容第15页
   ·论文结构安排第15-17页
第二章 相关概念介绍第17-21页
   ·Blog 概述第17-18页
     ·Blog 的概念第17页
     ·Blog 的基本特征和功能要素第17页
     ·Blog 的发展现状第17-18页
   ·爬虫工具介绍第18-19页
     ·爬虫工作原理第18-19页
     ·爬虫设计规范第19页
     ·Robots 协议介绍第19页
     ·SiteMap 介绍第19页
   ·文本挖掘第19-20页
     ·文本挖掘的概念第19页
     ·文本挖掘种类第19-20页
   ·复杂网络第20-21页
第三章 Blog 信息挖掘原型系统总体设计第21-25页
   ·主要功能模块的需求分析第21页
   ·系统总体框架第21-23页
   ·系统主要功能第23-24页
   ·工作重点与难点第24页
   ·小结第24-25页
第四章 数据收集和预处理模块设计与实现第25-38页
   ·Blog 的特点第25-26页
     ·Blog 页面的结构第25-26页
     ·HTML 中的超链接第26页
     ·Blog 页面的一般结构第26页
   ·Blog 爬虫设计第26-33页
   ·Blog 爬虫界面第33页
   ·信息抽取和预处理第33-37页
   ·小结第37-38页
第五章 文本分类模块设计与实现第38-46页
   ·文本预处理第38页
   ·特征提取第38-41页
     ·分词词典的设计第38-39页
     ·中文分词第39-40页
     ·特征选择算法第40-41页
   ·文本中特征词的统计第41-43页
   ·计算文章类别第43-44页
   ·话题的时间趋势分布第44-45页
   ·小结第45-46页
第六章 Blog 关系网络分析第46-61页
   ·Blog 主题讨论网络特征分析第46-49页
     ·Blog 的网络化描述第46-47页
     ·建立模型第47-48页
     ·Blog 网络的整体结构特性第48-49页
   ·Blog 关系网络的社团挖掘第49-55页
     ·社团挖掘方法第50页
     ·Blog 网络社团挖掘算法设计与实现第50-54页
     ·社团结构发现算法的精度验证第54-55页
   ·Blog 关系网络的核心结点查找第55-57页
     ·Blog 网络的中心化第55页
     ·核心查找算法第55-56页
     ·核心查找算法设计与实现第56-57页
     ·核心结点查找算法的有效性验证第57页
   ·Blog 网络图形化显示第57-60页
     ·Prefuse 功能介绍第57-58页
     ·软件框架的搭建与过程举例第58-59页
     ·Blog 网络图形化显示第59-60页
   ·小结第60-61页
第七章 测试与结论第61-68页
   ·测试环境第61页
   ·数据收集模块测试第61-63页
     ·爬虫对页面链接的发现能力第61-63页
     ·爬虫的执行效率评价第63页
   ·文本过滤模块的测试第63-65页
     ·文本分类效果测试第63-64页
     ·文本分类效率测试第64-65页
   ·网络分析模块的测试第65-66页
     ·随机生成网络测试第65-66页
     ·实际测试第66页
   ·小结第66-68页
结束语第68-70页
参考文献第70-74页
作者简历 攻读硕士学位期间完成的主要工作第74-75页
致谢第75页

论文共75页,点击 下载论文
上一篇:基于本体的Web服务QoS语义描述与服务选择研究
下一篇:基于IPv6的路由器级拓扑发现技术研究