基于UIMA的内容搜索

摘要	第1-5页
Abstract	第5-9页
第一章绪论	第9-19页
·文本挖掘发展概况及现状	第9-10页
·UIMA发展概况及现状	第10-14页
·选题依据和意义	第14-16页
·本文主要工作与创新	第16-17页
·本论文组织结构	第17-19页
第二章系统概述	第19-28页
·系统总体设计	第19-21页
·UIMA框架	第21-26页
·基本组件	第21-24页
·UIMA功能	第24-25页
·UIMA中的XML技术	第25页
·UIMA化自然语言处理工具——LingPipe	第25-26页
·UIMA应用——文档分析	第26-27页
·本章总结	第27-28页
第三章文本分类	第28-44页
·文本预处理	第28-29页
·文本特征表示	第29-33页
·文本特征	第29-30页
·N-Gram原理	第30-33页
·特征项提取和选择	第33-37页
·常用的文本特征提取方法	第33-35页
·交叉熵的文本特征选择	第35-37页
·分类器模型	第37-43页
·常用分类模型	第37-38页
·朴素贝叶斯分类	第38-43页
·文本分类评估	第43页
·本章总结	第43-44页
第四章文本分类具体实现	第44-62页
·训练阶段	第44-49页
·N-Gram及平滑技术	第44-48页
·训练分类器	第48-49页
·测试阶段	第49-59页
·分析引擎描述符	第49-55页
·文档标注	第55-57页
·分类测试文档集	第57-59页
·分类器评估	第59-61页
·本章总结	第61-62页
第五章文本分类的应用	第62-66页
·文本搜索	第62-63页
·在特定领域的应用	第63-66页
第六章文本分类实验结果和分析	第66-75页
·实验准备	第66-70页
·文档集	第66-69页
·实验输入和输出	第69-70页
·结果及分析	第70-74页
·本章总结	第74-75页
第七章结论	第75-78页
·本论文研究总结	第75-76页
·前景展望	第76-78页
致谢	第78-79页
参考文献	第79-82页
在学期间的研究成果	第82页