首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

文本数据挖掘在信息监控中的应用研究

摘要第1-7页
ABSTRACT第7-8页
1. 引言第8-12页
 1.1 研究背景第8-9页
  1.1.1 数据挖掘(Data Mining,简称DM)第9页
  1.1.2 WEB文本数据挖掘(Web Text Mining)第9页
 1.2 国内外研究现状第9-11页
 1.3 研究方向第11-12页
 1.4 研究意义第12页
 1.5 本文主要研究内容及组织第12页
2. 文本分类数据挖掘方法第12-17页
 2.1 支持向量机(Support Vector Machines,SVM)方法第13-15页
 2.2 向量空间模型第15页
 2.3 KNN(K-最近邻居)数据挖掘方法第15-17页
3. 基于信息搜索改进的信息监控第17-21页
 3.1 信息搜索方式第17-18页
 3.2 基于向量空间模型信息搜索原理第18页
 3.3 基于向量空间模型信息搜索算法第18-19页
 3.4 基于向量空间模型信息搜索改进基本思路第19页
 3.5 基于向量空间模型信息搜索改进算法第19-20页
 3.6 基于信息搜索改进的信息监控特点第20-21页
4. 信息监控系统总体设计第21-24页
 4.1 设计思想第21-22页
 4.2 体系结构第22页
 4.3 系统功能第22-24页
  4.3.1 WEB信息采集第22页
  4.3.2 文本自动分类第22-23页
  4.3.3 类别判断功能第23页
  4.3.4 有害信息报警第23页
  4.3.5 其它功能第23-24页
   4.3.5.1 网页操作第23页
   4.3.5.2 网页管理第23-24页
   4.3.5.3 网页查询汇总第24页
   4.3.5.4 网页分析预测第24页
   4.3.5.5 报表与统计第24页
5. WEB文本信息采集第24-28页
 5.1 信息采集定义第24页
 5.2 半结构化数据定义第24-25页
 5.3 Web结构挖掘--超链接分析算法思想第25-27页
 5.4 WEB文本信息自动采集第27-28页
  5.4.1 WEB文本信息自动采集流程图第27页
  5.4.2 Spider信息采集第27-28页
  5.4.3 页面分析,清除噪音第28页
  5.4.4 超链接提取第28页
  5.4.5 规范文本第28页
6. 文本自动分类第28-47页
 6.1 文本分类模型图第29-30页
 6.2 语料搜集和专业词表第30页
 6.3 中文分词第30-32页
  6.3.1 分词匹配算法第30页
  6.3.2 算法框架第30-32页
 6.4 文本训练参数窗口设计第32-34页
  6.4.1 参数窗口第32页
  6.4.2 训练文本分类模块程序框架第32-34页
 6.5 特征项的抽取第34-39页
  6.5.1 特征项抽取算法第35-37页
  6.5.2 互信息量或信息增益量算法程序实现第37-39页
 6.6 特征词权重计算第39-40页
 6.7 相似度计算程序实现第40-41页
 6.8 分类模块程序实现第41-44页
 6.9 阈值的确定第44-45页
 6.10 训练分类模型第45-47页
7. 总结及下一步工作第47-49页
参考文献第49-53页
致谢第53-54页

论文共54页,点击 下载论文
上一篇:表皮生长因子受体和PTEN蛋白在尖锐湿疣皮损中的表达与意义
下一篇:急性脑梗死患者血清sICAM-1、sE-selectin含量的变化及藻酸双酯钠(PSS)治疗的影响