首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Web数据挖掘及其在信息监控中的应用研究

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-20页
   ·课题背景及其研究意义第9-10页
   ·信息服务模式第10-12页
   ·Web挖掘的概念第12-13页
   ·Web挖掘与Web信息检索第13-14页
     ·Web信息检索的定义第13页
     ·Web挖掘和信息检索间的关联关系第13-14页
   ·Web挖掘研究方向第14-18页
     ·Web文本挖掘第16-17页
     ·Web结构挖掘第17-18页
     ·Web使用记录挖掘第18页
   ·本文的主要研究内容与组织机构第18-20页
第2章 文本分类数据挖掘算法第20-24页
   ·支持向量机算法第20-22页
   ·向量空间模型第22页
   ·KNN(K-最近邻居)数据挖掘方法第22-24页
第3章 基于VSM信息检索算法的改进第24-29页
   ·信息检索方式第24页
   ·基于VSM的信息检索原理和实现算法第24-25页
   ·基于VSM的信息检索算法的改进思路第25-26页
   ·基于VSM的信息检索的改进算法第26-27页
   ·信息检索改进算法在信息监控中的应用第27-29页
第4章 信息监控系统的总体设计第29-32页
   ·系统设计思想第29页
   ·系统的体系结构第29-30页
   ·系统主要功能第30-32页
     ·Web数据采集第30页
     ·文本数据自动分类第30页
     ·文本类别判断第30页
     ·有害信息报警第30页
     ·辅助处理功能第30-32页
第5章 WEB文本信息采集第32-36页
   ·半结构化数据的概念第32页
   ·Web结构挖掘——超链接分析算法思想第32-33页
   ·Web文本数据采集第33-36页
     ·Web文本数据的采集流程第33-34页
     ·Spider数据采集第34页
     ·页面分析,清除噪音第34-35页
     ·超链接提取第35页
     ·规范文本第35-36页
第6章 文本数据的自动分类第36-55页
   ·文本分类模型第36-37页
   ·语料搜集与建立专业词表第37页
   ·中文分词第37-39页
     ·分词匹配算法第37页
     ·匹配算法流程第37-39页
   ·文本训练参数的设置第39-42页
     ·训练参数配置窗口第39页
     ·训练文本分类模块的程序流程第39-42页
   ·特征项的抽取第42-45页
     ·特征项抽取算法第42-44页
     ·互信息量或信息增益量算法的程序实现第44-45页
   ·特征词权重的计算第45-47页
   ·相似度计算的程序实现第47-48页
   ·文本分类模块的程序实现第48-51页
   ·阈值的确定第51-52页
   ·应用实例第52-55页
第7章 结论与展望第55-57页
   ·论文期间的主要工作第55页
   ·进一步的工作第55-57页
参考文献第57-60页
致谢第60-61页
研究生履历第61页

论文共61页,点击 下载论文
上一篇:文本特征降维与分类规则抽取方法研究与应用
下一篇:宗教长期性的认识根源及心理根源研究