| 摘要 | 第1-4页 |
| ABSTRACT | 第4-7页 |
| 第一章 绪论 | 第7-14页 |
| ·研究背景和意义 | 第7页 |
| ·DNA编码序列检测的主要内容 | 第7-9页 |
| ·编码序列检测背景及方法 | 第9-11页 |
| ·编码序列检测的背景 | 第9页 |
| ·编码序列的检测方法 | 第9-11页 |
| ·本文的内容及结构 | 第11-14页 |
| ·本文的理论基础 | 第11-12页 |
| ·本文的结构安排 | 第12-14页 |
| 第二章 编码序列检测的基本原理 | 第14-22页 |
| ·常见的映射方法 | 第14-16页 |
| ·Voss映射 | 第14-15页 |
| ·Z曲线映射 | 第15页 |
| ·复数映射 | 第15-16页 |
| ·周期3特征 | 第16-19页 |
| ·周期3特征的产生 | 第16页 |
| ·周期3特性的检测 | 第16-19页 |
| ·滑动窗的作用 | 第19-22页 |
| ·滑动窗类型的选择 | 第20-21页 |
| ·滑动窗长度的选择 | 第21-22页 |
| 第三章 基于双端周期延拓滑动窗的周期3特征检测 | 第22-28页 |
| ·当前检测方法的不足 | 第22-24页 |
| ·双端周期延拓算法 | 第24-28页 |
| ·算法的提出 | 第24-26页 |
| ·算法的效果 | 第26-28页 |
| 第四章 CG含量特征和编码规则优化 | 第28-33页 |
| ·引入CG含量特征 | 第28-30页 |
| ·CG含量结合周期3特征 | 第30-31页 |
| ·DNA序列编码规则优化 | 第31-33页 |
| 第五章 实验结果对比及分析 | 第33-44页 |
| ·当前常用的数据集 | 第33-34页 |
| ·Burset/Guigo1996 | 第33页 |
| ·HMR195 | 第33页 |
| ·GENESCAN standard dataset | 第33-34页 |
| ·三大数据集的数据提取 | 第34页 |
| ·检测效果评价方法 | 第34-39页 |
| ·常规评价方法 | 第34-36页 |
| ·ROC评价方法 | 第36-39页 |
| ·基于HMR195的实验结果及分析 | 第39-42页 |
| ·不同延拓方法的比较 | 第39-40页 |
| ·CG含量和编码规则优化结果 | 第40-42页 |
| ·本文方法与当前方法的比较 | 第42-44页 |
| 第六章 基于支持向量机的DNA序列分类 | 第44-50页 |
| ·支持向量机理论 | 第44-46页 |
| ·机器学习的发展 | 第44页 |
| ·统计学基础 | 第44-45页 |
| ·支持向量机的理论基础 | 第45-46页 |
| ·支持向量机的实现 | 第46-47页 |
| ·支持向量机的简介 | 第46-47页 |
| ·惩罚因子和松弛变量 | 第47页 |
| ·基于周期3特征和CG含量的支持向量机分类 | 第47-50页 |
| ·支持向量机的设计 | 第47-48页 |
| ·支持向量机的分类效果 | 第48-50页 |
| 第七章 结论与展望 | 第50-51页 |
| 参考文献 | 第51-54页 |
| 发表论文和参加科研情况说明 | 第54-55页 |
| 致谢 | 第55页 |