基于半结构化文本的转运蛋白底物信息提取系统
| 摘要 | 第1-6页 |
| Abstract | 第6-9页 |
| 第1章 绪论 | 第9-17页 |
| ·研究的目的和意义 | 第9-10页 |
| ·国内外研究现状及发展趋势 | 第10-17页 |
| ·相关数据库的介绍 | 第11-15页 |
| ·生物文本挖掘方面的研究进展 | 第15-17页 |
| 第2章 相关的技术 | 第17-24页 |
| ·基于统计的机器学习方法 | 第17-21页 |
| ·最大熵方法 | 第17-19页 |
| ·朴素贝叶斯方法 | 第19-21页 |
| ·Porter 算法 | 第21-22页 |
| ·常用信息检索和提取的评价方法 | 第22-24页 |
| 第3章 系统的构建 | 第24-33页 |
| ·转运关系的定义 | 第25-26页 |
| ·训练数据集合 | 第26-28页 |
| ·转运蛋白底物关系数据 | 第26-27页 |
| ·注释域的选取 | 第27页 |
| ·训练数据的获得 | 第27-28页 |
| ·化合物名称识别 | 第28-29页 |
| ·分类器的实现及其性能的评价 | 第29-33页 |
| 第4章 系统的实现、功能和应用 | 第33-41页 |
| ·实现 | 第33-35页 |
| ·功能 | 第35-40页 |
| ·应用 | 第40-41页 |
| 第5章 结果的分析和讨论 | 第41-45页 |
| ·与转运过程密切相关的特征向量 | 第41-42页 |
| ·TSI 数据对比分析 | 第42-45页 |
| 结论 | 第45-47页 |
| 参考文献 | 第47-50页 |
| 附录 | 第50-53页 |
| 攻读学位期间发表论文与研究成果清单 | 第53-54页 |
| 致谢 | 第54页 |