首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Web挖掘的网情处理方法研究

摘要第1-10页
ABSTRACT第10-11页
第一章 绪论第11-23页
   ·研究背景及问题的提出第11-13页
     ·网络的快速发展引发了数据爆炸第11页
     ·信息获取能力与网络信息共享之间严重失衡第11-12页
     ·隐藏在互联网中的情报信息第12页
     ·Web网情处理现状第12-13页
   ·国内外研究现状第13-20页
     ·Web挖掘概述第14-16页
     ·应用研究第16-19页
     ·Web挖掘当前存在问题第19-20页
   ·本文研究内容第20-23页
     ·本文所做的工作第20-21页
     ·论文结构第21-23页
第二章 基于Web挖掘的情报处理方法的总体架构第23-34页
   ·Web网情挖掘的基本模式第23-25页
     ·网情处理工作简述第23-24页
     ·目前Web网情处理基本模式第24页
     ·基于Web挖掘的网情处理基本模式第24-25页
   ·Web网情处理框架第25-28页
     ·任务描述第25-26页
     ·方法实现第26-27页
     ·处理框架第27-28页
   ·方法研究的模块划分第28-34页
     ·MLDB架构第28-29页
     ·特征向量集第29-30页
     ·挖掘模型第30-31页
     ·主题词库概念第31-32页
     ·模块间的相互关系第32-34页
第三章 MLDB数据库的构建第34-42页
   ·Web数据的特点第34页
   ·数据的结构化与集成第34-38页
     ·XML文档存储分析第35-36页
     ·HTML向XML的转换第36-37页
     ·XML文档的有效性检查第37页
     ·XML数据处理第37-38页
   ·Web数据的存储第38-42页
     ·MLDB构建第38-39页
     ·基于MLDB的网情存储模式第39-41页
     ·Layer0的XML Schema设计第41-42页
第四章 主题概念特征向量集的设计第42-50页
   ·文档的向量表示法第42-45页
     ·文档的向量空间表示法第42页
     ·切分词处理第42-43页
     ·特征词的提取评估第43-45页
   ·主题词库构建第45-47页
     ·主题词库的提出第45-46页
     ·主题词库的构成第46-47页
   ·构造针对主题的概念特征向量第47-50页
     ·概念特征向量定义第47-48页
     ·各层次上的概念向量实现及相互关系第48-50页
第五章 挖掘模型的设计第50-57页
   ·资料处理挖掘模型第50页
   ·基于网情库的分类器第50-53页
     ·分类器特征向量的构造第51-52页
     ·分类挖掘第52-53页
   ·基于特征向量的聚类方法实现第53-56页
     ·相关概念第53-54页
     ·理论依据第54-55页
     ·数据准备第55页
     ·算法描述第55-56页
   ·对Web文档集聚类结果进行分类第56-57页
第六章 模块原型及数据验证第57-62页
   ·MLDB中Layer 0 层的Schema原型第57-58页
   ·算法分析及验证第58-60页
     ·不同特征词提取方法下的文本分类结果比较第58-59页
     ·阈值e的选择对聚类的影响第59-60页
   ·方法有效性分析第60-62页
第七章 结束语第62-64页
   ·本文所作的工作第62页
   ·需要进一步研究的问题第62-64页
致谢第64-65页
参考文献第65-69页
作者在学期间取得的学术成果第69-70页
附录A MLDB中第0层中XML的schema第70-71页

论文共71页,点击 下载论文
上一篇:旅团作战部队营房保障决策支持系统项目管理与需求研究
下一篇:基于责任模式资源平台关键技术的研究及实现