首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于粗糙集的“规则+例外”网页分类研究

摘要第1-5页
ABSTRACT第5-11页
第一章 引言第11-17页
   ·研究背景第11-12页
   ·网页分类的研究与发展第12-13页
   ·网页分类技术概述第13-15页
     ·中文网页文本分类的过程第13-15页
     ·中文网页信息结构的特点第15页
   ·本文主要工作第15-17页
     ·本文的创新点第16页
     ·论文的组织第16-17页
第二章 中文网页文本分类的关键技术第17-26页
   ·训练样本集第17页
   ·文本的表示模型第17-19页
     ·布尔模型第17-18页
     ·概率模型第18页
     ·向量空间模型第18-19页
   ·特征项提取第19-21页
     ·文档频率第19-20页
     ·信息增益第20页
     ·互信息第20页
     ·开方拟和检验第20-21页
   ·文本分类技术第21-26页
     ·文本分类模式第21-22页
     ·常用的文本分类方法第22-26页
第三章 基于粗糙集的“规则+例外”网页分类第26-44页
   ·粗糙集理论概述第26-27页
   ·粗糙集理论的主要概念第27-30页
   ·知识约简的计算方法第30-31页
   ·粗糙集理论在网页分类中的应用第31-32页
   ·规则归纳第32-37页
     ·常用的规则归纳方法第32-36页
     ·规则归纳的应用第36-37页
   ·例外分析第37-41页
     ·例外分析的方法第37-39页
     ·例外分析的应用第39-40页
     ·规则+例外学习的应用第40-41页
   ·基于粗糙集的“规则+例外”网页分类第41-44页
     ·面向用户需求的约简算法设计第42-43页
     ·规则与例外的选择第43-44页
第四章 基于粗糙集的“规则+例外”网页分类器设计第44-62页
   ·系统流程第44-45页
   ·实验平台的选择第45-46页
   ·实验语料数据第46-49页
     ·中文网页收集器工作原理第46页
     ·中文网页收集器设计第46-47页
     ·中文网页收集器实现第47-49页
   ·网页预处理第49-53页
     ·HTML解析第49-52页
     ·中文分词第52页
     ·去掉停用词第52-53页
   ·特征提取与权重计算算法设计第53-56页
     ·特征提取算法设计第53-54页
     ·改进的权重计算方法第54-56页
   ·建立条件属性向量与提取属性值域第56页
   ·面向用户需求的约简算法实现第56-58页
   ·分类算法第58-62页
第五章 实验结果与总结第62-66页
   ·分类质量评价与试验结果分析第62-64页
     ·分类性能评估指标第62-63页
     ·实验结果与分析第63-64页
   ·本文的总结第64页
   ·进一步的研究工作第64-66页
参考文献第66-70页
致谢第70-71页
攻读硕士学位期间发表的论文第71页

论文共71页,点击 下载论文
上一篇:快速Web开发与Super架构的研究与应用
下一篇:盐渍土地区公路自然区划研究