基于半监督学习的中文问句分类研究
| 摘要 | 第1-4页 |
| Abstract | 第4-6页 |
| 目录 | 第6-8页 |
| 第一章 引言 | 第8-14页 |
| ·研究背景及意义 | 第8-9页 |
| ·国内外研究现状 | 第9-11页 |
| ·问题的提出及解决方法 | 第11-12页 |
| ·本文的主要研究内容 | 第12页 |
| ·论文的组织 | 第12-14页 |
| 第二章 中文问句的特征提取 | 第14-25页 |
| ·引言 | 第14页 |
| ·中文问句特征空间构建 | 第14-16页 |
| ·特征维词语的提取 | 第15页 |
| ·特征词条组的提取 | 第15-16页 |
| ·利用词袋方法获取问句特征向量 | 第16-17页 |
| ·利用TF-IDF获取问句特征向量 | 第17-18页 |
| ·TF-IDF方法基本定义 | 第17页 |
| ·采用TFIDF方法进行特征值处理 | 第17-18页 |
| ·利用字面相似度计算方法获取问句特征向量 | 第18-20页 |
| ·字面相似度计算方法基本定义 | 第18-19页 |
| ·采用字面相似度计算方法进行特征值处理 | 第19-20页 |
| ·利用语义相似度计算方法获取问句特征向量 | 第20-24页 |
| ·词汇语义相似度计算基本定义 | 第20-23页 |
| ·采用语义相似度计算方法进行特征值处理 | 第23-24页 |
| ·本章小结 | 第24-25页 |
| 第三章 基于监督学习的问句分类模型 | 第25-34页 |
| ·引言 | 第25页 |
| ·决策树方法 | 第25-26页 |
| ·C4.5与Random Forest算法的选择 | 第26-27页 |
| ·基于监督学习的问句分类方法 | 第27-30页 |
| ·决策树C4.5算法 | 第27-28页 |
| ·随机森林(Random Forest)算法 | 第28-30页 |
| ·实验结果与分析 | 第30-33页 |
| ·本章小结 | 第33-34页 |
| 第四章 基于半监督学习的问句分类模型 | 第34-45页 |
| ·引言 | 第34页 |
| ·相关研究 | 第34-35页 |
| ·Co-forest协同学习算法 | 第35-36页 |
| ·基于半监督学习问句分类模型的实现方法 | 第36-38页 |
| ·实验结果与分析 | 第38-43页 |
| ·不同特征维度的半监督学习 | 第38-39页 |
| ·不同中文问句分类特征提取方法比较 | 第39-41页 |
| ·不同半监督学习算法比较 | 第41-42页 |
| ·不同无标记比例的半监督学习比较 | 第42-43页 |
| ·本章小结 | 第43-45页 |
| 第五章 云南旅游问句分类模型的设计与实现 | 第45-51页 |
| ·引言 | 第45页 |
| ·云南旅游领域问句的收集与组织 | 第45-46页 |
| ·实验结果与评价 | 第46-50页 |
| ·本章小结 | 第50-51页 |
| 第六章 结束语 | 第51-53页 |
| ·当前研究工作总结 | 第51页 |
| ·下一步研究设想 | 第51-53页 |
| 致谢 | 第53-54页 |
| 参考文献 | 第54-58页 |
| 附录A 攻读硕士期间发表论文及参与项目 | 第58-59页 |
| 附录B 攻读硕士学位期间申请的专利及软件著作权 | 第59页 |