Acknowledgements | 第1-15页 |
Abstract | 第15-19页 |
CHAPTER 1 INTRODUCTION | 第19-26页 |
·INTEGRATING PRIOR KNOWLEDGE INTO DATA MINING AND ITS APPLICATION | 第19-20页 |
·TRADITIONAL APPROACHES AND THEIR DISADVANTAGES | 第20-21页 |
·ONTOLOGY AIDED METHODS, FORMER RESEARCHES AND THEIR DISADVANTAGES | 第21-22页 |
·MAIN IDEA OF THE RESEARCH | 第22-23页 |
·THE STRUCTURE OF THE REMAINDER CHAPTERS | 第23-26页 |
CHAPTER 2 BACKGROUND | 第26-42页 |
·ONTOLOGY AND GENE ONTOLOGY | 第26-37页 |
·What is an ontology? | 第26-30页 |
·The role of ontology for knowledge management | 第30-31页 |
·Ontology representation language and reasoning | 第31-33页 |
·Gene Ontology | 第33-37页 |
·RESEARCHES IN BIOINFORMATICS DATA MINING | 第37-41页 |
·Central dogma of molecular biology | 第38-39页 |
·Hot topic one: sequence analysis | 第39页 |
·Hot topic two: microarray data analysis | 第39-41页 |
·SUMMARY | 第41-42页 |
CHAPTER 3 METHODOLOGY OF ONTOLOGY-AIDED METHOD FOR INTEGRATING PRIOR KNOWLEDGE INTO DATA MINING | 第42-56页 |
·COMPONENTS AND FRAMEWORK OF THE METHOD | 第42-43页 |
·DEMONSTRATION | 第43-55页 |
·Introduction of the subsection | 第45-46页 |
·Process | 第46-54页 |
·From metadata to ontology | 第47-48页 |
·Find out the prior knowledge from ontology | 第48-52页 |
·Association data mining with Apriori algorithm | 第52-53页 |
·Incorporate prior knowledge with the output of Apriori algorithm | 第53-54页 |
·Conclusion and future work | 第54-55页 |
·SUMMARY | 第55-56页 |
CHAPTER 4 RESEARCH ON PREDICTION OF PROTEIN SUBCELLULAR LOCATION | 第56-79页 |
·INTRODUCTION | 第56-58页 |
·ANALYSIS OF THE FEATURES EXTRACTED FROM SEQUENCE FOR THE PREDICTION OF SCL USING FOURIER TRANSFORM | 第58-67页 |
·Introduction of the subsection | 第58-59页 |
·Dataset used in the research | 第59-60页 |
·Extract features using Fourier transform | 第60-62页 |
·KNN method used in the test | 第62-64页 |
·Result and conclusion of the test | 第64-67页 |
·EXTRACTING FEATURES FROM GENE ONTOLOGY FOR PREDICTION OF PROTEIN SUBCELLULAR LOCATION BY SEMANTIC SIMILARITY MEASUREMENT | 第67-78页 |
·Introduction of the subsection | 第67-69页 |
·Method | 第69-73页 |
·Former method and its disadvantages | 第69-70页 |
·The novel method | 第70-73页 |
·Testing | 第73-77页 |
·Dataset | 第73页 |
·Extracting feature vectors | 第73-74页 |
·SVM as classifier | 第74-76页 |
·Testing result | 第76-77页 |
·Conclusion of the subsection | 第77-78页 |
·SUMMARY | 第78-79页 |
CHAPTER 5 RESEARCH ON ANALYSIS OF MICROARRAY DATASET | 第79-94页 |
·INTRODUCTION | 第79-82页 |
·Biological background of prediction functions of genes from their expression level | 第79-80页 |
·Former researches on the topic | 第80-81页 |
·The special data structure of the microarray dataset | 第81-82页 |
·GENE ONTOLOGY AIDED METHOD TO CONSTRUCT CLASSIFICATION MODELS FOR MICROARRAY DATA ANALYSIS | 第82-87页 |
·Obtain class hierarchy of ontology with an OWL DL reasoner | 第83-85页 |
·Algorithm to get classification subtree | 第85-87页 |
·DEMONSTRATION | 第87-92页 |
·CONCLUSION OF THE CHAPTER AND FUTURE WORKS | 第92-94页 |
CHAPTER 6 CONCLUSION AND FUTURE WORKS | 第94-97页 |
·CONCLUSION | 第94-96页 |
·On the research of association rules mining | 第94页 |
·In the research of prediction of protein subcellular location | 第94-95页 |
·Construct classification models aided by Gene Ontology | 第95页 |
·Summary | 第95-96页 |
·FUTURE WORKS | 第96-97页 |
REFERENCES | 第97-107页 |
PUBLICATIONS | 第107-110页 |
前言 | 第110-113页 |
CHAPTER 7 绪论 | 第113-118页 |
·将先验知识融入数据挖掘及其应用 | 第113-114页 |
·传统的方法及其不足 | 第114页 |
·本体辅助的方法,先前的研究及其不足 | 第114-115页 |
·本研究的主要思想 | 第115-116页 |
·以下章节的内容安排 | 第116-118页 |
CHAPTER 8 研究背景 | 第118-126页 |
·本体与基因本题 | 第118-122页 |
·本体是什么? | 第118-119页 |
·本体在知识管理中的作用 | 第119-120页 |
·本体的描述语言及其推理工具 | 第120-121页 |
·基因本体 | 第121-122页 |
·生物信息数据挖掘 | 第122-125页 |
·分子生物学中心法则 | 第123-124页 |
·研究热点一:序列分析 | 第124页 |
·研究热点二:微阵列数据分析 | 第124-125页 |
·总结 | 第125-126页 |
CHAPTER 9 本体辅助的先验知识融入数据挖掘的方法论 | 第126-134页 |
·方法的系统组件与框架 | 第126-127页 |
·示例 | 第127-133页 |
·本节的介绍 | 第128-129页 |
·步骤 | 第129-132页 |
·从元数据到本体 | 第130页 |
·从本体到先验知识 | 第130-131页 |
·采用Apriori 算法挖掘关联规则 | 第131-132页 |
·将先验知识与Apriori 算法的输出集成 | 第132页 |
·结论与研究展望 | 第132-133页 |
·总结 | 第133-134页 |
CHAPTER 10 预测蛋白质亚细胞定位的研究 | 第134-145页 |
·介绍 | 第134-135页 |
·对FOURIER 变换提取的蛋白质序列信息的分析 | 第135-138页 |
·本节的介绍 | 第135-136页 |
·研究中所用的数据集 | 第136页 |
·用Fourier 变换提取特征 | 第136页 |
·测试中用到的KNN 算法 | 第136页 |
·测试结果和结论 | 第136-138页 |
·通过测量语义相似性从基因本体中提取特征用以提高蛋白质SCL 预测精度 | 第138-144页 |
·本节的介绍 | 第138-139页 |
·方法 | 第139-142页 |
·先前的方法及其不足 | 第139-140页 |
·新的方法 | 第140-142页 |
·测试 | 第142-143页 |
·数据集 | 第142页 |
·提取特征向量 | 第142页 |
·SVM 作为分类器 | 第142页 |
·测试结果 | 第142-143页 |
·结论与研究展望 | 第143-144页 |
·总结 | 第144-145页 |
CHAPTER 11 微阵列数据集分析的研究 | 第145-149页 |
·介绍 | 第145-147页 |
·通过基因表达水平预测其功能的生物学背景 | 第145页 |
·关于这一主题先前的研究 | 第145-146页 |
·微阵列数据集具有的特殊的数据结构 | 第146-147页 |
·基因本体辅助的建立分类模型的方法 | 第147-148页 |
·通过OWL DL 推理机得到本体的层次分类模型 | 第147页 |
·得到分类子树的算法 | 第147-148页 |
·示例 | 第148页 |
·结论与研究展望 | 第148-149页 |
CHAPTER 12 总结与研究展望 | 第149-152页 |
·结论 | 第149-150页 |
·关于关联规则数据挖掘的研究 | 第149页 |
·关于预测蛋白质的亚细胞定位的研究 | 第149-150页 |
·关于微阵列数据分析的研究 | 第150页 |
·总结 | 第150页 |
·研究展望 | 第150-152页 |
参考文献 | 第152-158页 |
发表的论文列表 | 第158-159页 |
CHAPTER 13 致谢 | 第159页 |