首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于SVM有聚类指导的Web中文文本分类器的研究及其实现

第一章 引言第1-12页
 1.1 课题的研究背景和意义第8-9页
 1.2 课题研究现状第9-10页
 1.3 研究课题的来源和主要研究目的第10页
 1.4 本文的内容第10-12页
  1.4.1 研究内容第10-11页
  1.4.2 本文的组织第11-12页
第二章 文献综述第12-18页
 2.1 Web挖掘简介第12-13页
  2.1.1 Web挖掘的定义第12页
  2.1.2 Web挖掘的分类第12-13页
  2.1.3 Web挖掘面临的问题第13页
 2.2 Web文本挖掘(Web Text Mining)概述第13-15页
  2.2.1 Web文本挖掘的分类第14-15页
  2.2.2 文本挖掘和数据挖掘的关系第15页
 2.3 文本自动分类技术第15-18页
  2.3.1 问题描述第15-16页
  2.3.2 文本自动分类系统的类别第16页
  2.3.3 文本分类中计算机和人类学习过程的异同第16-18页
第三章 Web文本挖掘模型和相关技术第18-27页
 3.1 Web文本挖掘的处理模型第18-19页
 3.2 自动分词技术第19-22页
  3.2.1 自动分词算法分类第19-20页
  3.2.2 本模型应用的分词算法第20-22页
 3.3 特征表示与提取第22-27页
  3.3.1 项的选择第22-23页
  3.3.2 特征提取方法第23-24页
  3.3.3 Web网页的特征词条的获得第24-25页
  3.3.4 特征项的权重第25-27页
第四章 聚类算法第27-42页
 4.1 相似性度量第27-28页
 4.2 聚类方法的类别第28-29页
 4.3 类的定义第29-30页
 4.4 本模型中的三种聚类方法第30-42页
  4.4.1 改进的k-means聚类算法第30-32页
  4.4.2 基于高维稀疏数据的改进的 Bisect k-means 算法--HSMBK (Highdimension Sparse Modified Bisect k-means)第32-37页
   4.4.2.1 传统Bisectk-means算法第32-33页
   4.4.2.2 高维稀疏聚类第33-35页
    4.4.2.2.1 问题概述第34页
    4.4.2.2.2 布尔稀疏特征的概念第34页
    4.4.2.2.3 稀疏相似性的计算第34-35页
   4.4.2.3 聚簇中心的计算第35-36页
   4.4.2.4 判断k的标准-JW准则第36-37页
   4.4.2.5 HSMBK聚类算法的步骤第37页
  4.4.3 基于高维稀疏数据的快速聚类算法——HSSCA(HighdimensionSparseSwiftClusteringAlgorithm)第37-42页
   4.4.3.1 差异度的计算方法第38页
   4.4.3.2 稀疏特征向量第38-39页
   4.4.3.3 HSSCA算法的步骤第39-42页
第五章 SVM理论基础第42-51页
 5.1 统计学习理论第42-45页
  5.1.1 机器学习的基本问题表示第42页
  5.1.2 经验风险最小化第42-43页
  5.1.3 VC维第43页
  5.1.4 推广性的界第43-44页
  5.1.5 结构风险最小化原理第44-45页
 5.2 线性支持向量机第45-48页
  5.2.1 线性可分情况第45-48页
  5.2.2 软边缘第48页
 5.3 非线性支持向量机第48-50页
 5.4 支持向量机的特点第50-51页
第六章 中文文本分类算法第51-57页
 6.1 C-SVC(C-support vector classification)第51-55页
  6.1.1 问题描述第51-52页
  6.1.2 分类函数参数的确定(学习过程)第52-55页
   6.1.2.1 两个拉格朗日乘子的优化第53-54页
   6.1.2.2 两个待优化拉格朗日乘子的选择策略第54页
   6.1.2.3 阀值b的计算第54-55页
 6.2 V-SVC第55-56页
 6.3 多类分类问题的处理第56-57页
第七章 系统设计与实验测试第57-65页
 7.1 系统的具体实现第57-59页
  7.1.1 开发环境第57页
  7.1.2 系统模型第57页
  7.1.3 分类器模型的构造过程之比较第57-59页
 7.2 试验测试第59-60页
  7.2.1 训练集和测试集的划分第59页
  7.2.2. 模型质量评估第59-60页
 7.3 聚类算法的测试第60-63页
 7.4 SVM中采用不同的核函数和参数的测试结果。第63-65页
结束语第65-67页
 1. 本文的主要研究成果和创新点第65-66页
 2. 存在的问题和对未来工作的展望第66-67页
参考文献第67-69页
致谢第69-70页
附录A第70-73页
个人简历、在校期间的研究成果及发表的学术论文第73页

论文共73页,点击 下载论文
上一篇:白细胞介素10在大鼠脑缺血中的保护作用及其可能机制
下一篇:地点与文学创作:简·奥斯丁世界里的巴斯