中文摘要 | 第1-3页 |
Abstract | 第3-5页 |
目录 | 第5-9页 |
第1章 引 言 | 第9-14页 |
·课题目的和意义 | 第9-10页 |
·国内外研究状况和进展 | 第10-12页 |
·自动分类 | 第10-11页 |
·信息检索 | 第11-12页 |
·论文各部分的主要内容 | 第12-14页 |
第2章 常用分类及检索模型介绍 | 第14-27页 |
·分类及检索总体流程 | 第14-15页 |
·分类总体流程 | 第14页 |
·检索总体流程 | 第14-15页 |
·基本概念与定义 | 第15-16页 |
·常用分类模型 | 第16-22页 |
·基于规则的模型 | 第16-17页 |
·基于向量的模型 | 第17-20页 |
·基于概率的模型 | 第20-21页 |
·基于统计的模型 | 第21页 |
·模糊分类法(Fuzzy Classifier) | 第21-22页 |
·常用检索模型 | 第22-27页 |
·布尔模型(Boolean Model) | 第22-23页 |
·概率模型 | 第23页 |
·向量空间模型(Vector Space Model) | 第23-25页 |
·扩展布尔模型(Extended Boolean Model) | 第25-26页 |
·模糊集模型(Fuzzy Set Model) | 第26-27页 |
第3章 Rough集理论在分类与检索中的应用 | 第27-45页 |
·Rough集理论简介 | 第28-33页 |
·知识表与不可辨关系 | 第28-29页 |
·精确集与Rough集 | 第29-30页 |
·Rough集的近似集 | 第30-31页 |
·Rough度的数学度量 | 第31-32页 |
·决策表 | 第32-33页 |
·决策表属性约简 | 第33页 |
·Rough集理论在自动分类中的应用 | 第33-40页 |
·现有自动分类模型存在的问题 | 第33-35页 |
·自动分类与Rough集的对应 | 第35页 |
·Rough集理论用于分类的优势 | 第35-36页 |
·自动分类中约简算法的选择 | 第36-37页 |
·QR算法及其改进 | 第37-40页 |
·Rough集理论在信息检索中的应用 | 第40-45页 |
·分类与检索在模型上的差别 | 第40-41页 |
·等价关系与容差关系 | 第41-42页 |
·检索中容差关系的判定 | 第42-43页 |
·对象子集的相关度衡量 | 第43页 |
·检索具体步骤 | 第43-45页 |
第4章 自然语言处理通用模块的设计与实现 | 第45-58页 |
·模块划分与通信 | 第45-47页 |
·规范化处理模块 | 第47页 |
·句、段、标题识别模块 | 第47-48页 |
·分词与词性标注模块 | 第48-51页 |
·自动分词 | 第48-50页 |
·词性标注 | 第50-51页 |
·语义捆绑与特征提取模块 | 第51-56页 |
·统计单元 | 第51-52页 |
·《同义词词林》 | 第52-54页 |
·语义捆绑原则 | 第54-55页 |
·特征提取流程 | 第55-56页 |
·频率统计模块 | 第56页 |
·词频 | 第56页 |
·特征项频率(TF) | 第56页 |
·反文档频率(IDF) | 第56页 |
·邻接矩阵构造与计算模块 | 第56-57页 |
·预处理总体流程 | 第57-58页 |
第5章 自动分类及检索功能的设计与实现 | 第58-69页 |
·分类训练阶段 | 第58-61页 |
·文档矩阵及决策表的构造 | 第58-59页 |
·基于Rough集的特征项约简与加权 | 第59-61页 |
·分类训练阶段流程 | 第61页 |
·分类测试阶段 | 第61-63页 |
·待分类文档预处理 | 第61页 |
·类别隶属度计算 | 第61-62页 |
·分类矩阵调整 | 第62-63页 |
·分类测试阶段流程 | 第63页 |
·分类基础上检索功能的实现 | 第63-69页 |
·预处理 | 第63-64页 |
·字索引 | 第64-65页 |
·词及词位索引 | 第65-66页 |
·特征项邻接矩阵构造 | 第66页 |
·用户查询扩展 | 第66-67页 |
·文档与查询相关度计算 | 第67-69页 |
第6章 实验结果与分析 | 第69-86页 |
·实验环境 | 第69-70页 |
·语料库 | 第69页 |
·平台 | 第69页 |
·评价标准 | 第69-70页 |
·分类加权算法的实验结果与分析 | 第70-78页 |
·加权算法的选择 | 第70-71页 |
·其它算法的选择 | 第71页 |
·不同加权算法的召回率 | 第71-73页 |
·实验分析 | 第73-78页 |
·分类约简算法的实验结果与分析 | 第78-83页 |
·约简算法的选择 | 第78页 |
·其它算法的选择 | 第78页 |
·Rough集约简算法的约简度 | 第78-79页 |
·Rough集约简效果 | 第79-82页 |
·其它约简算法的约简效果 | 第82页 |
·约简算法的召回率比较 | 第82-83页 |
·IQR算法与QR算法的时间及完备性比较 | 第83-84页 |
·Rough集检索中的结果分布 | 第84页 |
·结论 | 第84-86页 |
第7章 未来工作展望 | 第86-90页 |
·中间文件格式改进 | 第86-87页 |
·统计与规则的结合 | 第87-88页 |
·实现多级分类 | 第88页 |
·扩充可处理文件格式 | 第88页 |
·实现WWW检索 | 第88-90页 |
参考文献 | 第90-94页 |
致 谢 | 第94页 |
声 明 | 第94-95页 |
个人简历 | 第95页 |
攻读硕士学位期间发表的学术论文 | 第95页 |