基于机器学习算法的非编码RNA识别
摘要 | 第6-8页 |
ABSTRACT | 第8-10页 |
第一章 绪论 | 第11-19页 |
1.1 选题背景和内容 | 第11-15页 |
1.2 国内外研究状况 | 第15-17页 |
1.2.1 microRNA的研究现状 | 第15-16页 |
1.2.2 piRNA的研究现状 | 第16页 |
1.2.3 lnRNA的研究现状 | 第16-17页 |
1.3 论文的主要工作和创新之处 | 第17-18页 |
1.4 论文的结构安排 | 第18-19页 |
第二章 基于极限学习机的miRNA前体的预测 | 第19-39页 |
2.1 miRNA的研究背景 | 第19-20页 |
2.2 miRNA数据的选取 | 第20-21页 |
2.3 miRNA特征的提取 | 第21-23页 |
2.3.1 最小自由能 | 第21页 |
2.3.2 结构多样性指标 | 第21页 |
2.3.3 优化的相邻结构序列特征 | 第21-23页 |
2.4 机器学习分类算法 | 第23-34页 |
2.4.1 支持向量机 | 第23-27页 |
2.4.2 极限学习机 | 第27-30页 |
2.4.3 随机森林 | 第30-34页 |
2.5 评价指标 | 第34页 |
2.6 极限学习机隐含层中最优结点个数的确定 | 第34-35页 |
2.7 OP-Triplet与ELM的性能 | 第35-36页 |
2.8 与其它算法的比较 | 第36-39页 |
第三章 基于投票极限学习机的piRNA的预测 | 第39-51页 |
3.1 piRNA的研究背景 | 第39-40页 |
3.2 piRNA数据的选取 | 第40页 |
3.3 piRNA特征的选取 | 第40-41页 |
3.3.1 k-mer模体 | 第40页 |
3.3.2 短序列模体(SSM) | 第40-41页 |
3.4 选择信息特征 | 第41-43页 |
3.5 投票的极限学习机(V-ELM) | 第43-44页 |
3.6 V-ELM中最优隐含层节点数的确定 | 第44-45页 |
3.7 机器学习算法的选择 | 第45页 |
3.8 与其它方法的比较 | 第45-48页 |
3.9 WEB服务器的构建 | 第48-51页 |
第四章 基于随机森林算法的长非编码RNA的预测 | 第51-73页 |
4.1 lncRNA的研究背景 | 第51-52页 |
4.2 lncRNA数据的来源 | 第52页 |
4.3 lncRNA训练数据的选取 | 第52-57页 |
4.4 lncRNA特征的选取 | 第57-61页 |
4.4.1 信噪比 | 第57-61页 |
4.4.2 开放阅读框特征 | 第61页 |
4.4.3 序列特征 | 第61页 |
4.5 信息特征的选择 | 第61-63页 |
4.6 实验结果和讨论 | 第63-64页 |
4.7 机器学习算法的选择 | 第64-69页 |
4.8 特征的重要性 | 第69页 |
4.9 算法的性能评估 | 第69-70页 |
4.10 与其他方法的比较 | 第70-71页 |
4.11 WEB服务器的构建 | 第71-73页 |
参考文献 | 第73-82页 |
致谢 | 第82-83页 |
攻读博士学位期间发表的论文 | 第83页 |