首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于特征选择的文件安全监控研究

致谢第1-6页
摘要第6-7页
ABSTRACT第7-11页
1 绪论第11-14页
   ·引言第11页
   ·研究背景与意义第11-12页
   ·研究内容第12页
   ·论文组织结构第12-13页
   ·本章小结第13-14页
2 相关内容介绍第14-25页
   ·字符串匹配第14页
   ·文本分类类别匹配第14-15页
   ·文本分类研究现状第15页
   ·中英文文本分类区别第15页
   ·文本分类的相关技术第15-17页
   ·文本分类的一般过程第17-18页
     ·训练过程第17-18页
     ·分类过程第18页
   ·文本预处理第18-19页
     ·分词第18页
     ·去停用词第18-19页
   ·特征降维第19页
   ·分类器分类第19-24页
     ·传统类中心分类算法第19页
     ·朴素贝叶斯算法(NB)第19-21页
     ·K最邻近算法(KNN)第21-22页
     ·支持向量机算法第22-24页
   ·文本分类技术的前景第24页
   ·本章小结第24-25页
3 特征选择算法研究第25-33页
   ·常用的特征选择算法第25-28页
     ·特征频率(TF Term Frequency)第25页
     ·文档频数(DF Document Frequency)第25-26页
     ·互信息(MI,Mutual Information)第26页
     ·信息增益(IG,Information Gain)第26-27页
     ·期望交互熵(ECE,Expected Cross Entropy)第27页
     ·χ~2统计量(也称卡方统计量CHI)第27-28页
     ·文本证据权(WET,Weight of Evidence for Text)第28页
   ·TFIDF算法第28-29页
   ·TFIDF算法缺陷第29页
   ·TFIDF算法改进第29-30页
   ·TFIDF算法改进实验分析第30-32页
   ·本章小结第32-33页
4 分类模块的设计第33-47页
   ·文件监控系统模型第33页
   ·本地搜索开源软件DocFetcher第33-43页
     ·DocFetcher的特点第34页
     ·DocFetcher的编译第34-41页
     ·例:遍历word文档接口类第41-43页
   ·预处理模块第43-44页
     ·ICTCLAS分词系统第43-44页
     ·去停用词流程第44页
   ·特征选择模块第44-45页
   ·待分类文本向量化第45页
   ·分类器分类模块第45-46页
   ·本章小结第46-47页
5 分类模块的实现第47-59页
   ·算法的数据结构第47页
   ·ICTCLAS分词系统的效果第47-49页
   ·去停用词的实现第49-50页
   ·特征选择第50-54页
     ·TFIDF算法实现第50-53页
     ·改进TFIDF算法实现第53-54页
   ·分类器的实现第54-56页
   ·界面的功能描述第56-58页
   ·本章小结第58-59页
6 实验与分析第59-64页
   ·实验评价标准第59-60页
   ·实验方法第60-62页
   ·实验分析第62-64页
7 总结与展望第64-65页
   ·工作总结第64页
   ·下一步展望第64-65页
参考文献第65-67页
作者简历第67-69页
学位论文数据集第69页

论文共69页,点击 下载论文
上一篇:基于数据挖掘的铁路隧道安全管理系统的研究实现
下一篇:基于HKS的非刚体三维模型检索与语义标注研究