中文专有名词识别的研究
摘要 | 第1-5页 |
Abstract | 第5-10页 |
1 绪论 | 第10-18页 |
·问题的提出 | 第10-11页 |
·中文专有名词识别的意义 | 第11-12页 |
·中文专有名词识别的特点与难点 | 第12-14页 |
·中文专有名词识别的特点 | 第12-14页 |
·中文专有名词识别的难点 | 第14页 |
·国内外研究现状 | 第14-16页 |
·基于规则的方法 | 第14-15页 |
·基于统计的方法 | 第15页 |
·规则和统计相结合的方法 | 第15-16页 |
·存在的问题 | 第16页 |
·本文的工作 | 第16-18页 |
2 支持向量机 | 第18-26页 |
·机器学习 | 第18-20页 |
·机器学习的相关概念 | 第18-19页 |
·机器学习问题的表示 | 第19-20页 |
·线性可分SVM | 第20-23页 |
·线性分类 | 第20-21页 |
·最大间隔分类器 | 第21-23页 |
·线性不可分SVM | 第23-24页 |
·高维空间的最优分类面 | 第24-26页 |
·核函数 | 第24-25页 |
·支持向量机 | 第25页 |
·多类分类问题 | 第25-26页 |
3 基于SVM的中文专有名词识别 | 第26-33页 |
·BIO分类标记 | 第26-27页 |
·抽取向量特性 | 第27-30页 |
·人名识别的特征 | 第27-29页 |
·地名识别的特征 | 第29-30页 |
·基于SVM的中文专有名词识别 | 第30-33页 |
4 基于混合模型的中文专有名词识别 | 第33-39页 |
·概率统计模型 | 第33-36页 |
·人名识别的概率统计模型 | 第33-35页 |
·地名识别的概率统计模型 | 第35-36页 |
·SVM和概率统计组合算法 | 第36-37页 |
·基于混合模型的中文专有名词识别 | 第37-39页 |
5 基于修正的SVM-KNN的中文专有名词识别 | 第39-44页 |
·修正的SVM-KNN算法 | 第39-41页 |
·K近邻(KNN)算法 | 第39-40页 |
·修正的K近邻算法 | 第40-41页 |
·修正的SVM-KNN算法 | 第41页 |
·基于修正的SVM-KNN算法的中文专有名词识别 | 第41-44页 |
6 基于修正的SVM分类器的中文专有名词识别 | 第44-51页 |
·不平衡数据集的机器学习 | 第44-46页 |
·修正的SVM分类器 | 第46-49页 |
·SVM分类超平面偏移的原因 | 第46-48页 |
·移动分界线 | 第48页 |
·修正的SVM算法 | 第48-49页 |
·基于修正的SVM分类器的中文专有名词识别 | 第49-51页 |
7 基于聚类的SVM算法的中文专有名词识别 | 第51-60页 |
·聚类算法 | 第51-53页 |
·聚类的定义及作用 | 第51-52页 |
·聚类算法的种类 | 第52-53页 |
·基于核-K均值聚类算法 | 第53-56页 |
·K-均值算法 | 第53-54页 |
·基于核-K均值聚类 | 第54-55页 |
·核函数 | 第55-56页 |
·基于聚类的SVM算法的中文专有名词识别 | 第56-60页 |
·特征向量的聚类 | 第57-58页 |
·训练与测试 | 第58-60页 |
8 实验结果与分析 | 第60-73页 |
·单纯使用SVM模型 | 第60-61页 |
·采用SVM和概率统计相结合的混合模型 | 第61-63页 |
·基于混合模型的人名识别 | 第61-62页 |
·基于混合模型的地名识别 | 第62-63页 |
·采用SVM与修正KNN组合模型 | 第63-66页 |
·基于SVM与修正KNN组合算法的人名识别 | 第63-65页 |
·基于SVM与修正KNN组合算法的地名识别 | 第65-66页 |
·采用修正的SVM模型 | 第66-67页 |
·采用聚类的SVM模型 | 第67-69页 |
·基于聚类的SVM模型的人名识别 | 第67-68页 |
·基于聚类的SVM模型的地名识别 | 第68-69页 |
·四种模型的比较 | 第69-70页 |
·与文献[21]、[22]的比较 | 第70-73页 |
结论 | 第73-75页 |
参考文献 | 第75-78页 |
附录A 分词词性表 | 第78-80页 |
攻读硕士学位期间发表学术论文情况 | 第80-81页 |
致谢 | 第81-82页 |
大连理工大学学位论文版权使用授权书 | 第82页 |