基于支持向量机的文本分类的研究
摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
1 绪论 | 第9-13页 |
·研究背景 | 第9页 |
·国内外研究现状 | 第9-10页 |
·国外研究现状 | 第10页 |
·国内研究现状 | 第10页 |
·课题研究的意义及主要内容 | 第10-11页 |
·课题研究的意义 | 第10-11页 |
·课题研究的主要内容 | 第11页 |
·课题研究的创新点 | 第11-12页 |
·论文的组织 | 第12-13页 |
2 文本分类综述 | 第13-19页 |
·文本特征的表示 | 第13-14页 |
·特征选择 | 第14-17页 |
·文档频率 | 第15页 |
·互信息 | 第15-16页 |
·信息增益 | 第16页 |
·期望交叉熵 | 第16页 |
·χ~2 统计 | 第16-17页 |
·性能指标 | 第17-19页 |
·查准率、查全率和F1 值 | 第17页 |
·微平均和宏平均 | 第17-19页 |
3 支持向量机理论 | 第19-29页 |
·统计学习理论 | 第19-23页 |
·学习过程的一致性 | 第19-20页 |
·VC 维和推广性的界 | 第20-22页 |
·结构风险最小化 | 第22-23页 |
·支持向量机 | 第23-27页 |
·最优分类面和广义最优分类面 | 第23-25页 |
·支持向量机 | 第25-26页 |
·核函数 | 第26-27页 |
·多分类支持向量机 | 第27-29页 |
·1-a-r 方法 | 第28页 |
·1-a-1 方法 | 第28-29页 |
4 基于文本特征的核函数 | 第29-46页 |
·核函数的性质 | 第29-30页 |
·核函数的一般构造方法 | 第30-33页 |
·构造核函数的条件 | 第30-31页 |
·从特征中构造核函数 | 第31-32页 |
·从核函数中构造核函数 | 第32-33页 |
·改进的基于文本特征的核函数 | 第33-46页 |
·核函数对文本分类的影响 | 第34-41页 |
·改进核在文本分类中的应用 | 第41-46页 |
5 核函数参数选择的优化 | 第46-55页 |
·核参数选择的一般方法 | 第46-48页 |
·经验法 | 第47页 |
·实验法 | 第47-48页 |
·理论法 | 第48页 |
·核函数参数选择原理 | 第48-50页 |
·简化的参数优化选择方法 | 第50-51页 |
·在文本分类中的应用 | 第51-55页 |
·数据集 | 第51-52页 |
·评价标准 | 第52页 |
·实验结果及分析 | 第52-55页 |
6. 结论与展望 | 第55-57页 |
·全文总结 | 第55页 |
·存在的问题和进一步的研究工作 | 第55-57页 |
参考文献 | 第57-61页 |