Web数据挖掘及其在信息监控中的应用研究

摘要	第1-6页
Abstract	第6-9页
第1章绪论	第9-20页
·课题背景及其研究意义	第9-10页
·信息服务模式	第10-12页
·Web挖掘的概念	第12-13页
·Web挖掘与Web信息检索	第13-14页
·Web信息检索的定义	第13页
·Web挖掘和信息检索间的关联关系	第13-14页
·Web挖掘研究方向	第14-18页
·Web文本挖掘	第16-17页
·Web结构挖掘	第17-18页
·Web使用记录挖掘	第18页
·本文的主要研究内容与组织机构	第18-20页
第2章文本分类数据挖掘算法	第20-24页
·支持向量机算法	第20-22页
·向量空间模型	第22页
·KNN(K-最近邻居)数据挖掘方法	第22-24页
第3章基于VSM信息检索算法的改进	第24-29页
·信息检索方式	第24页
·基于VSM的信息检索原理和实现算法	第24-25页
·基于VSM的信息检索算法的改进思路	第25-26页
·基于VSM的信息检索的改进算法	第26-27页
·信息检索改进算法在信息监控中的应用	第27-29页
第4章信息监控系统的总体设计	第29-32页
·系统设计思想	第29页
·系统的体系结构	第29-30页
·系统主要功能	第30-32页
·Web数据采集	第30页
·文本数据自动分类	第30页
·文本类别判断	第30页
·有害信息报警	第30页
·辅助处理功能	第30-32页
第5章 WEB文本信息采集	第32-36页
·半结构化数据的概念	第32页
·Web结构挖掘——超链接分析算法思想	第32-33页
·Web文本数据采集	第33-36页
·Web文本数据的采集流程	第33-34页
·Spider数据采集	第34页
·页面分析，清除噪音	第34-35页
·超链接提取	第35页
·规范文本	第35-36页
第6章文本数据的自动分类	第36-55页
·文本分类模型	第36-37页
·语料搜集与建立专业词表	第37页
·中文分词	第37-39页
·分词匹配算法	第37页
·匹配算法流程	第37-39页
·文本训练参数的设置	第39-42页
·训练参数配置窗口	第39页
·训练文本分类模块的程序流程	第39-42页
·特征项的抽取	第42-45页
·特征项抽取算法	第42-44页
·互信息量或信息增益量算法的程序实现	第44-45页
·特征词权重的计算	第45-47页
·相似度计算的程序实现	第47-48页
·文本分类模块的程序实现	第48-51页
·阈值的确定	第51-52页
·应用实例	第52-55页
第7章结论与展望	第55-57页
·论文期间的主要工作	第55页
·进一步的工作	第55-57页
参考文献	第57-60页
致谢	第60-61页
研究生履历	第61页