基于语义的中文文本特征降维方法研究
摘要 | 第1-4页 |
Abstract | 第4-6页 |
目录 | 第6-8页 |
第一章 绪论 | 第8-14页 |
·研究背景和意义 | 第8-9页 |
·国内外研究现状 | 第9-11页 |
·本文研究内容和工作 | 第11-12页 |
·本文的组织结构 | 第12-14页 |
第二章 中文文本分类相关技术 | 第14-28页 |
·文本分类的定义 | 第14-15页 |
·文本预处理 | 第15-18页 |
·去除文档中的格式标记 | 第15-16页 |
·过滤非法字符和字母大小写转换 | 第16页 |
·去除停用词 | 第16页 |
·词干化 | 第16-17页 |
·分词 | 第17-18页 |
·特征降维方法 | 第18-22页 |
·特征选择 | 第18-21页 |
·特征提取 | 第21-22页 |
·文本表示模型 | 第22-23页 |
·布尔模型 | 第22页 |
·向量空间模型 | 第22-23页 |
·概率模型 | 第23页 |
·常用的文本分类方法 | 第23-27页 |
·朴素贝叶斯 | 第23-24页 |
·K-近邻方法 | 第24-25页 |
·支持向量机 | 第25-26页 |
·神经网络 | 第26-27页 |
·决策树方法 | 第27页 |
·本章小结 | 第27-28页 |
第三章 基于语义的中文文本特征降维 | 第28-40页 |
·语义信息对特征降维的作用 | 第28页 |
·基于语义的特征降维思想 | 第28-30页 |
·基于语义的特征降维过程 | 第30-38页 |
·形成词汇-文档矩阵 | 第30-31页 |
·计算词语语义关系 | 第31-34页 |
·特征的语义聚类 | 第34-38页 |
·形成语义向量模型 | 第38页 |
·本章小结 | 第38-40页 |
第四章 实验设计与结果分析 | 第40-54页 |
·实验设计 | 第40-42页 |
·实验环境 | 第40页 |
·语料库选择 | 第40页 |
·文本分类方法的性能评估 | 第40-42页 |
·文本预处理过程 | 第42-45页 |
·形成词汇-文档矩阵 | 第45-49页 |
·特征融合 | 第49页 |
·实验结果与分析 | 第49-53页 |
·混淆矩阵 | 第49-50页 |
·各个类别的分类指标对比 | 第50-52页 |
·总体指标对比 | 第52-53页 |
·本章小结 | 第53-54页 |
第五章 总结和展望 | 第54-56页 |
·总结 | 第54-55页 |
·进一步的工作 | 第55-56页 |
致谢 | 第56-58页 |
参考文献 | 第58-64页 |
作者在攻读硕士期间的科研成果 | 第64页 |