中文摘要 | 第1-6页 |
英文摘要 | 第6-11页 |
1 绪论 | 第11-16页 |
·论文研究的意义 | 第12-13页 |
·国内外研究现状 | 第13-14页 |
·本文研究的目的和研究内容 | 第14-15页 |
·本文研究的目的 | 第14页 |
·本文研究的主要内容 | 第14-15页 |
·本文的主要内容 | 第15-16页 |
2 文本分类技术 | 第16-31页 |
·文本分类的评估指标基础 | 第16-18页 |
·文本分类概述 | 第18-20页 |
·文本表示模型 | 第20-21页 |
·文本特征提取 | 第21-23页 |
·特征权重计算 | 第23-24页 |
·文本分类算法 | 第24-28页 |
·Rocchio | 第24页 |
·类中心向量最近距离判别算法 | 第24-25页 |
·朴素贝叶斯(Naive Bayes) | 第25页 |
·K-邻近算法(KNN) | 第25-26页 |
·支持向量机(Support Vector Machine,简记为SVM) | 第26-27页 |
·决策树(Decision Tree) | 第27页 |
·线性最小二乘拟合(Linear Least Squares Fit,简记为LLSF) | 第27页 |
·神经网络(Neural Network) | 第27-28页 |
·中文文本分类面临的问题及改进的方向 | 第28-29页 |
·文本的层次分类简介 | 第29-30页 |
·本章小结 | 第30-31页 |
3 基于向量空间模型的中文文本层次分类方法研究 | 第31-38页 |
·层次分类的相关研究 | 第31-33页 |
·关于层次分类的问题 | 第33-34页 |
·解决方法 | 第34-37页 |
·二重特征选择 | 第34-36页 |
·文本层次分类算法 | 第36-37页 |
·本章小结 | 第37-38页 |
4 基于最大熵模型的中文文本层次分类方法研究 | 第38-47页 |
·背景及基本思想 | 第38-39页 |
·最大熵原理 | 第39-41页 |
·熵的定义 | 第39-40页 |
·最大熵理论 | 第40-41页 |
·最大熵模型 | 第41-44页 |
·最大熵模型满足的条件 | 第41-42页 |
·特征函数 | 第42页 |
·最大熵模型的构造 | 第42-43页 |
·参数求解 | 第43-44页 |
·基于最大熵模型的中文文本层次分类 | 第44-46页 |
·基本思路与方法 | 第44-45页 |
·在层次分类中的具体做法 | 第45-46页 |
·本章小结 | 第46-47页 |
5 实验方法、结果分析及在唐诗分类中的应用 | 第47-57页 |
·实验方法 | 第47-48页 |
·实验数据 | 第47页 |
·实验参数 | 第47-48页 |
·结果评估 | 第48页 |
·实验结果及分析 | 第48-53页 |
·实验一:基于向量空间模型的层次分类方法实验 | 第48-52页 |
·实验二:基于最大熵模型的层次分类方法实验 | 第52-53页 |
·层次分类在唐诗分类中的应用 | 第53-56页 |
·实验方案 | 第53页 |
·实验数据 | 第53-54页 |
·实验结果及分析 | 第54-56页 |
·本章小结 | 第56-57页 |
6 结论与展望 | 第57-59页 |
·主要结论 | 第57页 |
·研究工作的展望 | 第57-59页 |
致谢 | 第59-60页 |
参考文献 | 第60-63页 |
附录 | 第63-64页 |
独创性声明 | 第64页 |
学位论文版权使用授权书 | 第64页 |