首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

数字图书馆的中文网页文本分类器研究

摘要第1-4页
ABSTRACT第4-5页
目录第5-7页
第1章 绪论第7-15页
 1.1 选题背景及意义第7-8页
 1.2 国内外研究现状第8-14页
  1.2.1 数字图书馆第8-9页
  1.2.2 数字图书馆的个性化服务第9-11页
  1.2.3 分类技术的研究现状第11-14页
 1.3 论文所作的工作第14-15页
第2章 问题的描述第15-20页
 2.1 系统对象分析第15页
 2.2 数字图书馆需求概述第15-16页
 2.3 总体需求图第16-17页
 2.4 总体数据流程图第17-18页
 2.5 系统总体模块图第18-19页
 2.6 网页文本分类的功能及其作用面第19-20页
第3章 网页文本分类第20-32页
 3.1 文本分类第20-22页
  3.1.1 文本分类的定义第20页
  3.1.2 文本分类的应用第20-22页
  3.1.3 文本分类的过程第22页
 3.2 网页文本分类过程第22-24页
  3.2.1 网页信息处理第22-23页
  3.2.2 文本预处理第23页
  3.2.3 文本表示第23页
  3.2.4 特征选取第23-24页
  3.2.5 特征匹配和分类第24页
 3.3 分类算法及其评价指标第24-32页
  3.3.1 分类算法第25-28页
  3.3.2 分类算法性能比较第28-29页
  3.3.3 分类算法的评价指标第29-32页
第4章 网页信息的自动提取第32-37页
 4.1 网页信息分析第32-34页
  4.1.1 结构信息第32-33页
  4.1.2 与分类密切相关的HTML标记第33-34页
 4.2 网页数据模型第34-35页
 4.3 网页信息提取流程图第35-37页
第5章 中文网页分类器的模型设计第37-47页
 5.1 系统结构图第37页
 5.2 系统模块设计第37-38页
 5.3 系统用到的分类体系第38-43页
 5.4 分类器处理流程图第43-44页
 5.5 系统中用到的几个算法第44-45页
  5.5.1 特征选取算法第44页
  5.5.2 KNN分类算法及其阈值策略第44-45页
 5.6 结果的表示和存储第45页
 5.7 返回结果对数字图书馆系统的支持第45-46页
 5.8 本文设计的分类器与搜索引擎的分类器的区别第46-47页
第6章 总结与展望第47-49页
 6.1 全文总结第47页
 6.2 下一步工作及展望第47-49页
参考文献第49-52页
致谢第52-53页
研究生期间公开发表的论文第53页

论文共53页,点击 下载论文
上一篇:俄罗斯亚太战略分析
下一篇:中国县级政府预算程序研究--以兴山县为例