首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于主题信息采集中网页分类系统研究

摘要第1-4页
Abstract第4-8页
第一章 绪言第8-11页
   ·课题研究背景第8-10页
     ·问题的提出第8-9页
     ·自动分类的研究简介第9-10页
   ·本文研究内容第10页
   ·本文安排第10-11页
第二章 相关技术综述第11-28页
   ·Spider采集技术第11-21页
     ·Spider研究第11-12页
     ·Spider应用第12页
     ·采集Web页面的Spider程序第12-21页
   ·中文切分词技术第21-25页
     ·汉语自动分词中的困难第21-23页
     ·自动分词算法的分类第23-25页
   ·中文文本分类技术第25-28页
     ·文本分类概述第25-26页
     ·文本分类的类型第26页
     ·文本分类的模型第26-28页
第三章 总体设计第28-31页
   ·基于主题信息采集中网页分类系统模型设计第28页
   ·基于主题信息采集的网页分类系统模型的关键问题第28-30页
     ·主题选择第28页
     ·初始 URL选择第28页
     ·Spider采集第28页
     ·页面解析第28-30页
     ·中文分词第30页
     ·文本分类第30页
   ·本论文创新点第30-31页
第四章 Spider设计及页面解析第31-42页
   ·Spider设计第31-37页
     ·Spider采集第32-33页
     ·Spider采集程序实现第33-37页
   ·页面解析第37-42页
     ·HTML页面解析第37-40页
     ·页面解析后的存储第40-42页
第五章 中文分词与特征提取第42-55页
   ·中文分词第42-53页
     ·中文词典和停用词词典第43页
     ·中文分词实现第43-53页
   ·特征提取第53-55页
     ·文本特征词的选取第53页
     ·特征词选取的程序实现第53-55页
第六章 贝叶斯分类及其实现第55-62页
   ·朴素贝叶斯模型第55-56页
   ·对朴素贝叶斯模型的改进第56页
   ·朴素贝叶斯分类器的实现第56-60页
     ·朴素贝叶斯多元模型分类算法第56-57页
     ·朴素贝叶斯多元模型分类器的实现第57-60页
   ·朴素贝叶斯分类器的实践第60-62页
     ·衡量指标第60页
     ·测试及结果分析第60-62页
第七章 总结与展望第62-63页
   ·本论文研究成果第62页
   ·进一步的工作第62-63页
致谢第63-64页
参考文献第64-69页
附录:攻读学位期间发表论文情况第69页

论文共69页,点击 下载论文
上一篇:论水浒传英雄杀戮行为
下一篇:辛芷鼻敏胶囊对变应性鼻炎大鼠模型P物质和组胺的影响