| Acknowledgements | 第1-15页 |
| Abstract | 第15-19页 |
| CHAPTER 1 INTRODUCTION | 第19-26页 |
| ·INTEGRATING PRIOR KNOWLEDGE INTO DATA MINING AND ITS APPLICATION | 第19-20页 |
| ·TRADITIONAL APPROACHES AND THEIR DISADVANTAGES | 第20-21页 |
| ·ONTOLOGY AIDED METHODS, FORMER RESEARCHES AND THEIR DISADVANTAGES | 第21-22页 |
| ·MAIN IDEA OF THE RESEARCH | 第22-23页 |
| ·THE STRUCTURE OF THE REMAINDER CHAPTERS | 第23-26页 |
| CHAPTER 2 BACKGROUND | 第26-42页 |
| ·ONTOLOGY AND GENE ONTOLOGY | 第26-37页 |
| ·What is an ontology? | 第26-30页 |
| ·The role of ontology for knowledge management | 第30-31页 |
| ·Ontology representation language and reasoning | 第31-33页 |
| ·Gene Ontology | 第33-37页 |
| ·RESEARCHES IN BIOINFORMATICS DATA MINING | 第37-41页 |
| ·Central dogma of molecular biology | 第38-39页 |
| ·Hot topic one: sequence analysis | 第39页 |
| ·Hot topic two: microarray data analysis | 第39-41页 |
| ·SUMMARY | 第41-42页 |
| CHAPTER 3 METHODOLOGY OF ONTOLOGY-AIDED METHOD FOR INTEGRATING PRIOR KNOWLEDGE INTO DATA MINING | 第42-56页 |
| ·COMPONENTS AND FRAMEWORK OF THE METHOD | 第42-43页 |
| ·DEMONSTRATION | 第43-55页 |
| ·Introduction of the subsection | 第45-46页 |
| ·Process | 第46-54页 |
| ·From metadata to ontology | 第47-48页 |
| ·Find out the prior knowledge from ontology | 第48-52页 |
| ·Association data mining with Apriori algorithm | 第52-53页 |
| ·Incorporate prior knowledge with the output of Apriori algorithm | 第53-54页 |
| ·Conclusion and future work | 第54-55页 |
| ·SUMMARY | 第55-56页 |
| CHAPTER 4 RESEARCH ON PREDICTION OF PROTEIN SUBCELLULAR LOCATION | 第56-79页 |
| ·INTRODUCTION | 第56-58页 |
| ·ANALYSIS OF THE FEATURES EXTRACTED FROM SEQUENCE FOR THE PREDICTION OF SCL USING FOURIER TRANSFORM | 第58-67页 |
| ·Introduction of the subsection | 第58-59页 |
| ·Dataset used in the research | 第59-60页 |
| ·Extract features using Fourier transform | 第60-62页 |
| ·KNN method used in the test | 第62-64页 |
| ·Result and conclusion of the test | 第64-67页 |
| ·EXTRACTING FEATURES FROM GENE ONTOLOGY FOR PREDICTION OF PROTEIN SUBCELLULAR LOCATION BY SEMANTIC SIMILARITY MEASUREMENT | 第67-78页 |
| ·Introduction of the subsection | 第67-69页 |
| ·Method | 第69-73页 |
| ·Former method and its disadvantages | 第69-70页 |
| ·The novel method | 第70-73页 |
| ·Testing | 第73-77页 |
| ·Dataset | 第73页 |
| ·Extracting feature vectors | 第73-74页 |
| ·SVM as classifier | 第74-76页 |
| ·Testing result | 第76-77页 |
| ·Conclusion of the subsection | 第77-78页 |
| ·SUMMARY | 第78-79页 |
| CHAPTER 5 RESEARCH ON ANALYSIS OF MICROARRAY DATASET | 第79-94页 |
| ·INTRODUCTION | 第79-82页 |
| ·Biological background of prediction functions of genes from their expression level | 第79-80页 |
| ·Former researches on the topic | 第80-81页 |
| ·The special data structure of the microarray dataset | 第81-82页 |
| ·GENE ONTOLOGY AIDED METHOD TO CONSTRUCT CLASSIFICATION MODELS FOR MICROARRAY DATA ANALYSIS | 第82-87页 |
| ·Obtain class hierarchy of ontology with an OWL DL reasoner | 第83-85页 |
| ·Algorithm to get classification subtree | 第85-87页 |
| ·DEMONSTRATION | 第87-92页 |
| ·CONCLUSION OF THE CHAPTER AND FUTURE WORKS | 第92-94页 |
| CHAPTER 6 CONCLUSION AND FUTURE WORKS | 第94-97页 |
| ·CONCLUSION | 第94-96页 |
| ·On the research of association rules mining | 第94页 |
| ·In the research of prediction of protein subcellular location | 第94-95页 |
| ·Construct classification models aided by Gene Ontology | 第95页 |
| ·Summary | 第95-96页 |
| ·FUTURE WORKS | 第96-97页 |
| REFERENCES | 第97-107页 |
| PUBLICATIONS | 第107-110页 |
| 前言 | 第110-113页 |
| CHAPTER 7 绪论 | 第113-118页 |
| ·将先验知识融入数据挖掘及其应用 | 第113-114页 |
| ·传统的方法及其不足 | 第114页 |
| ·本体辅助的方法,先前的研究及其不足 | 第114-115页 |
| ·本研究的主要思想 | 第115-116页 |
| ·以下章节的内容安排 | 第116-118页 |
| CHAPTER 8 研究背景 | 第118-126页 |
| ·本体与基因本题 | 第118-122页 |
| ·本体是什么? | 第118-119页 |
| ·本体在知识管理中的作用 | 第119-120页 |
| ·本体的描述语言及其推理工具 | 第120-121页 |
| ·基因本体 | 第121-122页 |
| ·生物信息数据挖掘 | 第122-125页 |
| ·分子生物学中心法则 | 第123-124页 |
| ·研究热点一:序列分析 | 第124页 |
| ·研究热点二:微阵列数据分析 | 第124-125页 |
| ·总结 | 第125-126页 |
| CHAPTER 9 本体辅助的先验知识融入数据挖掘的方法论 | 第126-134页 |
| ·方法的系统组件与框架 | 第126-127页 |
| ·示例 | 第127-133页 |
| ·本节的介绍 | 第128-129页 |
| ·步骤 | 第129-132页 |
| ·从元数据到本体 | 第130页 |
| ·从本体到先验知识 | 第130-131页 |
| ·采用Apriori 算法挖掘关联规则 | 第131-132页 |
| ·将先验知识与Apriori 算法的输出集成 | 第132页 |
| ·结论与研究展望 | 第132-133页 |
| ·总结 | 第133-134页 |
| CHAPTER 10 预测蛋白质亚细胞定位的研究 | 第134-145页 |
| ·介绍 | 第134-135页 |
| ·对FOURIER 变换提取的蛋白质序列信息的分析 | 第135-138页 |
| ·本节的介绍 | 第135-136页 |
| ·研究中所用的数据集 | 第136页 |
| ·用Fourier 变换提取特征 | 第136页 |
| ·测试中用到的KNN 算法 | 第136页 |
| ·测试结果和结论 | 第136-138页 |
| ·通过测量语义相似性从基因本体中提取特征用以提高蛋白质SCL 预测精度 | 第138-144页 |
| ·本节的介绍 | 第138-139页 |
| ·方法 | 第139-142页 |
| ·先前的方法及其不足 | 第139-140页 |
| ·新的方法 | 第140-142页 |
| ·测试 | 第142-143页 |
| ·数据集 | 第142页 |
| ·提取特征向量 | 第142页 |
| ·SVM 作为分类器 | 第142页 |
| ·测试结果 | 第142-143页 |
| ·结论与研究展望 | 第143-144页 |
| ·总结 | 第144-145页 |
| CHAPTER 11 微阵列数据集分析的研究 | 第145-149页 |
| ·介绍 | 第145-147页 |
| ·通过基因表达水平预测其功能的生物学背景 | 第145页 |
| ·关于这一主题先前的研究 | 第145-146页 |
| ·微阵列数据集具有的特殊的数据结构 | 第146-147页 |
| ·基因本体辅助的建立分类模型的方法 | 第147-148页 |
| ·通过OWL DL 推理机得到本体的层次分类模型 | 第147页 |
| ·得到分类子树的算法 | 第147-148页 |
| ·示例 | 第148页 |
| ·结论与研究展望 | 第148-149页 |
| CHAPTER 12 总结与研究展望 | 第149-152页 |
| ·结论 | 第149-150页 |
| ·关于关联规则数据挖掘的研究 | 第149页 |
| ·关于预测蛋白质的亚细胞定位的研究 | 第149-150页 |
| ·关于微阵列数据分析的研究 | 第150页 |
| ·总结 | 第150页 |
| ·研究展望 | 第150-152页 |
| 参考文献 | 第152-158页 |
| 发表的论文列表 | 第158-159页 |
| CHAPTER 13 致谢 | 第159页 |