基于非平衡数据的生物文献分类研究
| 摘要 | 第1-5页 |
| Abstract | 第5-7页 |
| 目录 | 第7-9页 |
| 第1章 绪论 | 第9-22页 |
| ·课题来源 | 第9页 |
| ·选题的目的和意义 | 第9-11页 |
| ·相关领域国内外研究现状 | 第11-20页 |
| ·生物学文献管理研究现状 | 第11-12页 |
| ·文本分类研究现状 | 第12-16页 |
| ·不均衡数据问题研究现状 | 第16-20页 |
| ·本文研究内容及结构 | 第20-22页 |
| 第2章 文献数据集采集与量化分析 | 第22-29页 |
| ·文献的采集 | 第22-24页 |
| ·待分类文献样本采集 | 第22页 |
| ·学习实例样本采集 | 第22-24页 |
| ·文献的特征分析 | 第24-28页 |
| ·文献研究内容分析 | 第24-26页 |
| ·文献数据量化分析 | 第26-28页 |
| ·本章小结 | 第28-29页 |
| 第3章 文本预处理相关技术的研究 | 第29-36页 |
| ·词库的获取 | 第29-31页 |
| ·典型的特征降维方法 | 第31-33页 |
| ·基于 TF-IDF 的文本表示 | 第33页 |
| ·词与词组混合特征空间 | 第33-35页 |
| ·本章小结 | 第35-36页 |
| 第4章 面向 SVM 的文本分类研究 | 第36-46页 |
| ·SVM 简介及核函数选择 | 第36-39页 |
| ·SVM 参数寻优方法选择 | 第39-41页 |
| ·不均衡数据的处理 | 第41-43页 |
| ·文本分类性能评估方法及指标 | 第43-45页 |
| ·本章小结 | 第45-46页 |
| 第5章 结果分析与研究 | 第46-54页 |
| ·CHI 与词组混合特征空间分析 | 第46-47页 |
| ·特征寻优算法的研究 | 第47-48页 |
| ·重采样策略结合核函数分类分析与研究 | 第48-51页 |
| ·文献数据集合分类预测研究 | 第51-53页 |
| ·大豆类文献数据集合分类研究 | 第51-52页 |
| ·作物类文献数据集合分类研究 | 第52页 |
| ·动物类文献数据集合分类研究 | 第52-53页 |
| ·本章小结 | 第53-54页 |
| 第6章 总结与展望 | 第54-56页 |
| ·全文工作总结 | 第54页 |
| ·研究展望 | 第54-56页 |
| 致谢 | 第56-57页 |
| 参考文献 | 第57-60页 |