中文摘要 | 第5-6页 |
ABSTRACT | 第6页 |
1. 绪论 | 第9-15页 |
1.1 课题研究背景和意义 | 第9-10页 |
1.2 问答系统综述 | 第10-13页 |
1.2.1 问答系统体系结构 | 第10-11页 |
1.2.2 问答系统国内外研究现状 | 第11-13页 |
1.3 本文研究主要内容 | 第13-14页 |
1.4 论文组织结构 | 第14-15页 |
2. 问答系统相关技术及算法的比较与分析 | 第15-29页 |
2.1 问题理解阶段 | 第15-18页 |
2.1.1 问句预处理 | 第15-16页 |
2.1.2 问题分类 | 第16-18页 |
2.2 信息检索阶段 | 第18页 |
2.3 答案抽取阶段 | 第18-19页 |
2.4 基于支持向量机的问题分类 | 第19-28页 |
2.4.1 支持向量机基础 | 第19-20页 |
2.4.2 二分类问题 | 第20-23页 |
2.4.3 模型及参数选择 | 第23页 |
2.4.4 分类模型准确率的估计方法 | 第23-24页 |
2.4.5 多分类模型 | 第24-28页 |
2.5 本章小结 | 第28-29页 |
3. 特征选择策略研究 | 第29-39页 |
3.1 特征选择的重要性 | 第29页 |
3.2 特征选择基础知识 | 第29-31页 |
3.2.1 信息增益(Information Gain) | 第29-30页 |
3.2.2 互信息(Mutual Information) | 第30页 |
3.2.3 x~2 统计 | 第30-31页 |
3.3 基本特征选择 | 第31-33页 |
3.3.1 基于bag-of-words和N-gram选择特征 | 第31页 |
3.3.2 基于词性和词意选择特征 | 第31-32页 |
3.3.3 基于依存关系选择特征 | 第32页 |
3.3.4 基于组合选择特征 | 第32-33页 |
3.4 本文提出的方法 | 第33-38页 |
3.4.1 根据分数选择特征(F+SVM) | 第34-36页 |
3.4.2 根据分数和随机森林选择特征(F+RF+SVM) | 第36-37页 |
3.4.3 根据随机森林和SVM相结合选择特征(RF+RM-SVM) | 第37-38页 |
3.5 本章小结 | 第38-39页 |
4. 基于一对多分割二叉树支持向量机的问题分类 | 第39-51页 |
4.1 决策树基础知识 | 第39-43页 |
4.1.1 有向无环图支持向量机 | 第39-40页 |
4.1.2 自适应有向无环图 | 第40-41页 |
4.1.3 中心二叉树支持向量机 | 第41-43页 |
4.2 算法的主要思想 | 第43-44页 |
4.3 划分函数 | 第44页 |
4.4 SMO算法及其改进 | 第44-48页 |
4.4.1 SMO算法 | 第44-46页 |
4.4.2 改进的SMO算法 | 第46-48页 |
4.5 算法的主要过程 | 第48页 |
4.6 分类算法复杂度分析 | 第48-50页 |
4.6.1 基于SVM多分类算法复杂度比较 | 第48-49页 |
4.6.2 基于SVM和高阶支持向量机(SHTM)多分类算法的时间复杂度比较 | 第49-50页 |
4.7 本章小结 | 第50-51页 |
5. 中文问题分类系统 | 第51-61页 |
5.1 系统结构设计 | 第51-52页 |
5.2 功能模块实现 | 第52-55页 |
5.3 典型问题分类算法实验结果比较 | 第55-56页 |
5.4 本文提出的特征选择策略实验结果分析 | 第56-59页 |
5.4.1 BER值比较 | 第56-57页 |
5.4.2 分数临界值分析 | 第57-59页 |
5.4.3 问题分类精度比较 | 第59页 |
5.5 本章小结 | 第59-61页 |
6. 总结与展望 | 第61-63页 |
6.1 总结 | 第61页 |
6.2 展望 | 第61-63页 |
参考文献 | 第63-66页 |
攻读硕士学位期间发表学术论文情况 | 第66-67页 |
致谢 | 第67-68页 |
作者简介 | 第68-69页 |