DNA序列比较的K-词非频率模型研究及应用
| 摘要 | 第1-6页 |
| Abstract | 第6-8页 |
| 目录 | 第8-10页 |
| CONTENTS | 第10-12页 |
| 图表目录 | 第12-14页 |
| 主要符号表 | 第14-15页 |
| 1 绪论 | 第15-27页 |
| ·问题提出与研究意义 | 第15-20页 |
| ·进化树简介 | 第16-18页 |
| ·进化树构建方法简介 | 第18页 |
| ·进化分析介绍 | 第18-19页 |
| ·数学准备知识 | 第19-20页 |
| ·国内外相关研究进展 | 第20-24页 |
| ·比对方法介绍 | 第20页 |
| ·非比对方法介绍 | 第20-24页 |
| ·本文主要研究思路与内容 | 第24-27页 |
| 2 基于k-词的统计距离 | 第27-46页 |
| ·引言 | 第27页 |
| ·统计距离的定义 | 第27-29页 |
| ·统计距离的复杂度 | 第29页 |
| ·评价方法 | 第29-32页 |
| ·结果和讨论 | 第32-44页 |
| ·相似性搜索 | 第32-33页 |
| ·进化树重建 | 第33-40页 |
| ·最小非零距离 | 第40页 |
| ·k-词长度的选取 | 第40-44页 |
| ·本章小结 | 第44-46页 |
| 3 基于k-词线性回归模型的新距离及应用 | 第46-64页 |
| ·引言 | 第46页 |
| ·材料和方法 | 第46-54页 |
| ·k-词分布序列 | 第46-47页 |
| ·k-词分布序列的平均距离 | 第47-49页 |
| ·相似性距离 | 第49页 |
| ·生物序列数据集 | 第49-54页 |
| ·结果和讨论 | 第54-62页 |
| ·最小二乘估计 | 第54-55页 |
| ·构建进化树 | 第55-62页 |
| ·与其他方法进行比较 | 第62页 |
| ·本章小结 | 第62-64页 |
| 4 基于k-词位置信息的相似性距离 | 第64-76页 |
| ·引言 | 第64页 |
| ·方法 | 第64-66页 |
| ·k-词位置序列 | 第64-65页 |
| ·简化的k-词位置序列 | 第65页 |
| ·新的统计距离 | 第65-66页 |
| ·新距离的算法复杂度 | 第66页 |
| ·结果和讨论 | 第66-74页 |
| ·24条脊椎动物转铁蛋白基因的进化树 | 第66-69页 |
| ·48条E型肝炎病毒的进化树 | 第69-73页 |
| ·20条真兽类哺乳动物线粒体DNA的进化树 | 第73页 |
| ·k-词长度的选取 | 第73-74页 |
| ·本章小结 | 第74-76页 |
| 5 结论与展望 | 第76-78页 |
| 参考文献 | 第78-88页 |
| 攻读博士学位期间科研项目及科研成果 | 第88-89页 |
| 致谢 | 第89-90页 |
| 作者简介 | 第90-91页 |