首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于行为识别的网页文本分类算法研究与实现

摘要第1-5页
Abstract第5-9页
第一章 前言第9-13页
   ·研究背景和意义第9-10页
   ·国内外文本分类发展概况第10-11页
     ·国外发展概况第10-11页
     ·国内研究发展概况第11页
   ·课题研究的主要内容第11-12页
   ·论文的组织结构第12-13页
第二章 网页自动分类工作流程和关键技术第13-24页
   ·网页分类的基本概念第13页
   ·网页文本自动分类基本工作流程第13-14页
   ·建立文本集及预处理第14-16页
     ·网络爬虫第14-15页
     ·网页预处理第15-16页
   ·文本表示第16-17页
     ·布尔模型第16-17页
     ·向量空间模型第17页
     ·概率模型第17页
   ·特征提取第17-19页
     ·信息增益第18页
     ·期望交叉熵第18页
     ·互信息第18-19页
     ·X~2统计量第19页
   ·常用分类算法第19-23页
     ·基于统计的分类方法第19-22页
     ·基于规则的分类方法第22-23页
   ·分类算法评估第23-24页
第三章 网页行为识别研究第24-45页
   ·网页结构分析第24-27页
     ·网页的架构第24-25页
     ·搜索引擎优化的行为分析第25-27页
   ·网页文本预处理第27-33页
     ·网页文本预处理对象第27-29页
     ·网页文本编码第29-31页
     ·去掉网页文本特殊字符第31页
     ·网页语言大小写统一第31-33页
   ·基于行为识别的网页分类算法第33-45页
     ·基于行文识别的网页分类算法的提出及公式第33-34页
     ·分类类别介绍第34-45页
第四章 基于行为识别的网页分类算法设计与实现第45-55页
   ·分类器程序第45-47页
     ·开发环境第45-46页
     ·程序功能介绍第46-47页
   ·算法实现第47-54页
   ·分类结果第54-55页
第五章 分类结果分析第55-62页
   ·测试程序第55-61页
     ·功能介绍第55-56页
     ·程序流程第56-61页
   ·测试结果第61-62页
第六章 总结及展望第62-63页
参考文献第63-66页
致谢第66-67页
攻读学位期间发表的学术论文目录第67页

论文共67页,点击 下载论文
上一篇:模块化分布式路由器管理平面研究与实现
下一篇:基于LAMP平台架构的网页防篡改系统设计与实现