首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于半监督学习的中文问句分类研究

摘要第1-4页
Abstract第4-6页
目录第6-8页
第一章 引言第8-14页
   ·研究背景及意义第8-9页
   ·国内外研究现状第9-11页
   ·问题的提出及解决方法第11-12页
   ·本文的主要研究内容第12页
   ·论文的组织第12-14页
第二章 中文问句的特征提取第14-25页
   ·引言第14页
   ·中文问句特征空间构建第14-16页
     ·特征维词语的提取第15页
     ·特征词条组的提取第15-16页
   ·利用词袋方法获取问句特征向量第16-17页
   ·利用TF-IDF获取问句特征向量第17-18页
     ·TF-IDF方法基本定义第17页
     ·采用TFIDF方法进行特征值处理第17-18页
   ·利用字面相似度计算方法获取问句特征向量第18-20页
     ·字面相似度计算方法基本定义第18-19页
     ·采用字面相似度计算方法进行特征值处理第19-20页
   ·利用语义相似度计算方法获取问句特征向量第20-24页
     ·词汇语义相似度计算基本定义第20-23页
     ·采用语义相似度计算方法进行特征值处理第23-24页
   ·本章小结第24-25页
第三章 基于监督学习的问句分类模型第25-34页
   ·引言第25页
   ·决策树方法第25-26页
   ·C4.5与Random Forest算法的选择第26-27页
   ·基于监督学习的问句分类方法第27-30页
     ·决策树C4.5算法第27-28页
     ·随机森林(Random Forest)算法第28-30页
   ·实验结果与分析第30-33页
   ·本章小结第33-34页
第四章 基于半监督学习的问句分类模型第34-45页
   ·引言第34页
   ·相关研究第34-35页
   ·Co-forest协同学习算法第35-36页
   ·基于半监督学习问句分类模型的实现方法第36-38页
   ·实验结果与分析第38-43页
     ·不同特征维度的半监督学习第38-39页
     ·不同中文问句分类特征提取方法比较第39-41页
     ·不同半监督学习算法比较第41-42页
     ·不同无标记比例的半监督学习比较第42-43页
   ·本章小结第43-45页
第五章 云南旅游问句分类模型的设计与实现第45-51页
   ·引言第45页
   ·云南旅游领域问句的收集与组织第45-46页
   ·实验结果与评价第46-50页
   ·本章小结第50-51页
第六章 结束语第51-53页
   ·当前研究工作总结第51页
   ·下一步研究设想第51-53页
致谢第53-54页
参考文献第54-58页
附录A 攻读硕士期间发表论文及参与项目第58-59页
附录B 攻读硕士学位期间申请的专利及软件著作权第59页

论文共59页,点击 下载论文
上一篇:虚拟毛笔模型的虚拟墨迹与真实墨迹的比对研究
下一篇:基于多层递阶预测理论和灰色预测理论的能源管理信息系统研究与设计