首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于粗糙集的Web文本分类技术研究

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-16页
   ·WEB 文本分类的研究背景和意义第10-11页
   ·WEB 文本分类的研究现状及前景第11-13页
   ·粗糙集理论的研究现状第13-14页
   ·论文组织结构第14-16页
第二章 WEB 文本分类概述第16-31页
   ·文本分类的基本概念第16页
   ·WEB 文本分类系统的流程设计第16-18页
   ·WEB 文本预处理第18-19页
   ·特征提取方法第19-23页
     ·文档频率第19-20页
     ·信息增益第20页
     ·互信息第20-21页
     ·期望交叉熵第21-22页
     ·χ2 统计量第22-23页
   ·特征项的权重计算第23页
   ·常用文本分类算法第23-30页
     ·支持向量机第24-25页
     ·K-近邻第25-27页
     ·决策树第27-29页
     ·朴素贝叶斯第29-30页
   ·本章小结第30-31页
第三章 粗糙集理论第31-46页
   ·粗糙集的基本概念第31-34页
     ·知识与分类第31-32页
     ·不可分辨关系第32页
     ·两个知识库的关系第32页
     ·集合的下近似和上近似第32-33页
     ·粗糙集和精确集第33-34页
     ·集合的近似精度和粗糙度第34页
   ·粗糙集理论中的知识表示第34-35页
   ·知识约简第35-40页
     ·知识的约简与核第36页
     ·知识的相对约简和相对核第36-38页
     ·决策表中知识约简的一般步骤第38-40页
   ·常用的知识约简算法第40-45页
     ·盲目删除属性约简第40-42页
     ·基于属性重要度的约简第42-43页
     ·基于区分矩阵的约简第43-45页
   ·本章小结第45-46页
第四章 WEB 文本特征项权重计算及改进第46-52页
   ·特征项权重计算方法第46-48页
     ·布尔函数第46-47页
     ·TF-IDF 函数第47页
     ·Okapi 函数第47-48页
   ·TF-IDF 权重计算方法的不足与改进第48-50页
     ·TF-IDF 算法的不足第48-49页
     ·TF-IDF 算法的改进第49-50页
   ·权重离散化第50-51页
   ·本章小结第51-52页
第五章 基于粗糙集理论的WEB 文本分类第52-66页
   ·基于粗糙集的WEB 文本分类方法的处理流程第52-53页
     ·WEB 文本分类器的构造流程第52-53页
     ·WEB 文本分类器的测试流程第53页
   ·WEB 文本的预处理第53-57页
     ·网页噪声的去除第54-55页
     ·中文分词第55-56页
     ·去停用词第56-57页
   ·特征项的提取第57页
   ·特征项权重的计算第57-58页
   ·特征项权重的离散化第58页
   ·决策表的构造及约简第58-60页
   ·决策规则的表示第60-61页
   ·WEB 文本分类测试与结果分析第61-65页
     ·分类数据的评价指标第61-62页
     ·实验数据及步骤第62-65页
   ·本章小结第65-66页
第六章 结论与展望第66-68页
   ·研究总结第66-67页
   ·后续工作第67-68页
参考文献第68-72页
致谢第72-73页

论文共73页,点击 下载论文
上一篇:海量地形数据绘制技术研究与实现
下一篇:基于本体的智能搜索技术实现