基于潜在语义分析的真核启动子识别
摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
1 背景 | 第10-17页 |
·生物信息学 | 第10-11页 |
·遗传物质DNA | 第11-12页 |
·启动子 | 第12-13页 |
·启动子现有识别算法 | 第13-16页 |
·本文结构安排 | 第16-17页 |
2 主要技术 | 第17-27页 |
·DNA 序列数据的表示方法 | 第17-18页 |
·序列频率表示法 | 第17页 |
·布尔函数表示法 | 第17-18页 |
·TF-IDF 公式表示法 | 第18页 |
·潜在语义索引LSI | 第18-21页 |
·潜在语义索引的全局模型与局部模型 | 第20页 |
·差异模型 | 第20-21页 |
·支持向量机 | 第21-24页 |
·谱聚类中的数据表示 | 第24-25页 |
·数据的相似图表示 | 第24-25页 |
·图的矩阵表示方法 | 第25页 |
·评价指标 | 第25-26页 |
·小结 | 第26-27页 |
3 基于潜在语义索引全局模型的启动子识别 | 第27-34页 |
·潜在语义索引全局模型 | 第27页 |
·全局模型识别算法 | 第27-29页 |
·实验及结果分析 | 第29-33页 |
·实验结果 | 第29-31页 |
·抽样对于算法结果的影响 | 第31页 |
·过滤阈值对于结果的影响 | 第31-32页 |
·表示方式对于结果的影响 | 第32-33页 |
·小结 | 第33-34页 |
4 基于潜在语义差异模型的启动子识别 | 第34-42页 |
·潜在语义索引差异模型DLSI | 第34-35页 |
·启动子识别算法 | 第35-36页 |
·实验结果与分析 | 第36-41页 |
·实验结果 | 第36-38页 |
·表示方式对结果的影响 | 第38-39页 |
·min_sup 阈值对于结果的影响 | 第39-40页 |
·差异模型优势 | 第40-41页 |
·小结 | 第41-42页 |
5 基因序列的相似性度量与启动子识别中的样本选择 | 第42-53页 |
·序列的相似性分析 | 第42-43页 |
·拉普拉斯矩阵的性质 | 第43-45页 |
·非归一化的拉普拉斯矩阵 | 第43-44页 |
·归一化的拉普拉斯矩阵 | 第44-45页 |
·基于拉普拉斯特征值的相似性度量 | 第45-49页 |
·基于交叉熵的相似性度量 | 第49-50页 |
·基于谱分析的分类样本选择与评价 | 第50-51页 |
·结论 | 第51-53页 |
6 结束语 | 第53-54页 |
参考文献 | 第54-56页 |
致谢 | 第56-57页 |
攻读硕士学位期间发表的论文 | 第57-58页 |