首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于结构信息的中文网页自动分类技术研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-14页
   ·论文研究背景第9页
   ·国内外研究现状第9-12页
     ·文本分类的研究现状第9-11页
     ·网页自动分类的研究现状第11-12页
   ·论文的研究内容第12页
   ·论文的组织结构第12-14页
第二章 中文网页分类的相关技术第14-31页
   ·文本分类的概念第14页
   ·中文网页分类的一般过程第14-15页
   ·中文网页分类的关键技术第15-28页
     ·中文分词技术第15-17页
     ·文本表示第17-19页
     ·文本特征项的权重计算第19-21页
     ·降维技术第21-23页
     ·文本分类算法第23-28页
   ·文本分类的评价标准第28-30页
   ·本章小结第30-31页
第三章 基于结构信息的网页分类方法第31-49页
   ·网页特性分析及可利用的结构信息第31-32页
   ·网页分类有效内容提取第32-39页
     ·网页信息抽取研究进展第33页
     ·基于DOM 的分类有效内容提取第33-39页
   ·利用结构信息加强网页分类效果的方法第39-40页
     ·结构标注第40页
     ·结构划分第40页
   ·基于结构划分的朴素贝叶斯分类第40-44页
     ·算法描述第40-41页
     ·分类器的构造过程第41-43页
     ·分类过程第43-44页
   ·实验和结论第44-47页
     ·实验数据集介绍第44页
     ·主题文本抽取实验及结果分析第44-46页
     ·基于结构划分的朴素贝叶斯分类实验第46-47页
   ·本章小结第47-49页
第四章 基于结构信息的网页层次分类第49-59页
   ·层次化文本分类概述第49-51页
     ·类别层次结构的类型第49-50页
     ·层次化文本分类的实现途径第50页
     ·层次化分类的优点第50-51页
   ·基于朴素贝叶斯的层次化文本分类第51-54页
     ·自底向上构建层次化分类模型第51-53页
     ·自顶向下的层次化分类过程第53-54页
   ·融入结构信息的网页层次分类第54-56页
     ·分类模型的构建第54-55页
     ·分类过程第55-56页
   ·实验和结论第56-58页
     ·实验数据集介绍第56页
     ·实验设置及结果分析第56-58页
   ·本章小结第58-59页
第五章 总结和展望第59-61页
   ·论文工作总结第59-60页
   ·未来工作展望第60-61页
参考文献第61-65页
致谢第65-66页
在学期间的研究成果及发表的学术论文第66页

论文共66页,点击 下载论文
上一篇:基于RSS信息源的用户兴趣模型研究
下一篇:基于UCON访问控制模型的信息安全监控系统的研究