基于语义的中文文本特征降维方法研究
| 摘要 | 第1-4页 |
| Abstract | 第4-6页 |
| 目录 | 第6-8页 |
| 第一章 绪论 | 第8-14页 |
| ·研究背景和意义 | 第8-9页 |
| ·国内外研究现状 | 第9-11页 |
| ·本文研究内容和工作 | 第11-12页 |
| ·本文的组织结构 | 第12-14页 |
| 第二章 中文文本分类相关技术 | 第14-28页 |
| ·文本分类的定义 | 第14-15页 |
| ·文本预处理 | 第15-18页 |
| ·去除文档中的格式标记 | 第15-16页 |
| ·过滤非法字符和字母大小写转换 | 第16页 |
| ·去除停用词 | 第16页 |
| ·词干化 | 第16-17页 |
| ·分词 | 第17-18页 |
| ·特征降维方法 | 第18-22页 |
| ·特征选择 | 第18-21页 |
| ·特征提取 | 第21-22页 |
| ·文本表示模型 | 第22-23页 |
| ·布尔模型 | 第22页 |
| ·向量空间模型 | 第22-23页 |
| ·概率模型 | 第23页 |
| ·常用的文本分类方法 | 第23-27页 |
| ·朴素贝叶斯 | 第23-24页 |
| ·K-近邻方法 | 第24-25页 |
| ·支持向量机 | 第25-26页 |
| ·神经网络 | 第26-27页 |
| ·决策树方法 | 第27页 |
| ·本章小结 | 第27-28页 |
| 第三章 基于语义的中文文本特征降维 | 第28-40页 |
| ·语义信息对特征降维的作用 | 第28页 |
| ·基于语义的特征降维思想 | 第28-30页 |
| ·基于语义的特征降维过程 | 第30-38页 |
| ·形成词汇-文档矩阵 | 第30-31页 |
| ·计算词语语义关系 | 第31-34页 |
| ·特征的语义聚类 | 第34-38页 |
| ·形成语义向量模型 | 第38页 |
| ·本章小结 | 第38-40页 |
| 第四章 实验设计与结果分析 | 第40-54页 |
| ·实验设计 | 第40-42页 |
| ·实验环境 | 第40页 |
| ·语料库选择 | 第40页 |
| ·文本分类方法的性能评估 | 第40-42页 |
| ·文本预处理过程 | 第42-45页 |
| ·形成词汇-文档矩阵 | 第45-49页 |
| ·特征融合 | 第49页 |
| ·实验结果与分析 | 第49-53页 |
| ·混淆矩阵 | 第49-50页 |
| ·各个类别的分类指标对比 | 第50-52页 |
| ·总体指标对比 | 第52-53页 |
| ·本章小结 | 第53-54页 |
| 第五章 总结和展望 | 第54-56页 |
| ·总结 | 第54-55页 |
| ·进一步的工作 | 第55-56页 |
| 致谢 | 第56-58页 |
| 参考文献 | 第58-64页 |
| 作者在攻读硕士期间的科研成果 | 第64页 |