中文文本分类的研究与应用
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-9页 |
| 第1章 绪论 | 第9-15页 |
| ·研究背景 | 第9-10页 |
| ·研究意义 | 第10-11页 |
| ·文本分类方法 | 第11-12页 |
| ·国内外研究现状 | 第12-14页 |
| ·国外研究现状 | 第12-13页 |
| ·国内研究现状 | 第13-14页 |
| ·本文的组织结构 | 第14-15页 |
| 第2章 常用文本分类算法研究 | 第15-27页 |
| ·文本的数学表示模型 | 第15-18页 |
| ·布尔逻辑模型 | 第15页 |
| ·向量空间模型 | 第15-17页 |
| ·概率推理模型 | 第17-18页 |
| ·潜在语义索引模型 | 第18页 |
| ·常用文本分类算法研究 | 第18-26页 |
| ·中心向量算法 | 第19页 |
| ·K近邻算法 | 第19-20页 |
| ·决策树算法 | 第20-21页 |
| ·神经网络算法 | 第21页 |
| ·支持向量机算法 | 第21-22页 |
| ·遗传算法 | 第22-23页 |
| ·粗糙集方法 | 第23页 |
| ·朴素贝叶斯算法 | 第23-26页 |
| ·小结 | 第26-27页 |
| 第3章 特征约简方法 | 第27-43页 |
| ·中文分词 | 第27-28页 |
| ·特征选择 | 第28-31页 |
| ·文档频率 | 第28-29页 |
| ·信息增益 | 第29页 |
| ·互信息 | 第29-30页 |
| ·X~2统计 | 第30页 |
| ·期望交叉熵 | 第30-31页 |
| ·文本证据权 | 第31页 |
| ·几率比 | 第31页 |
| ·基于特征相关性的特征选择 | 第31-37页 |
| ·特征相关性分析 | 第32页 |
| ·特征关联性度量 | 第32-35页 |
| ·基于特征相关性的特征选择 | 第35-37页 |
| ·一种改进的特征选择方法 | 第37-42页 |
| ·基于类别分布的特征选择 | 第38-40页 |
| ·改进的二次特征选择方法 | 第40-42页 |
| ·小结 | 第42-43页 |
| 第4章 特征权重估算方法 | 第43-50页 |
| ·常用的特征加权方法 | 第43-46页 |
| ·布尔权重 | 第43页 |
| ·基于熵概念的权重 | 第43-44页 |
| ·特征频率权重 | 第44页 |
| ·IDF权重 | 第44-45页 |
| ·TF-IDF权重 | 第45-46页 |
| ·改进的特征加权估算方法 | 第46-49页 |
| ·小结 | 第49-50页 |
| 第5章 向量优化技术在朴素贝叶斯文本分类上的应用 | 第50-55页 |
| ·引言 | 第50页 |
| ·向量优化技术在朴素贝叶斯文本分类上的应用 | 第50-51页 |
| ·评估办法 | 第51-52页 |
| ·测试工具及分类语料 | 第52页 |
| ·实验结果与分析 | 第52-54页 |
| ·开放性测试和封闭性测试 | 第53-54页 |
| ·三种贝叶斯分类器对比测试 | 第54页 |
| ·小结 | 第54-55页 |
| 第6章 总结和展望 | 第55-56页 |
| ·本文工作总结 | 第55页 |
| ·研究前景展望 | 第55-56页 |
| 致谢 | 第56-57页 |
| 参考文献 | 第57-61页 |
| 攻读学位期间的研究成果 | 第61页 |