首页--语言、文字论文--语言学论文--应用语言学论文--机器翻译论文

基于粗集理论的中文文本自动分类与检索研究

中文摘要第1-3页
Abstract第3-5页
目录第5-9页
第1章 引 言第9-14页
   ·课题目的和意义第9-10页
   ·国内外研究状况和进展第10-12页
     ·自动分类第10-11页
     ·信息检索第11-12页
   ·论文各部分的主要内容第12-14页
第2章 常用分类及检索模型介绍第14-27页
   ·分类及检索总体流程第14-15页
     ·分类总体流程第14页
     ·检索总体流程第14-15页
   ·基本概念与定义第15-16页
   ·常用分类模型第16-22页
     ·基于规则的模型第16-17页
     ·基于向量的模型第17-20页
     ·基于概率的模型第20-21页
     ·基于统计的模型第21页
     ·模糊分类法(Fuzzy Classifier)第21-22页
   ·常用检索模型第22-27页
     ·布尔模型(Boolean Model)第22-23页
     ·概率模型第23页
     ·向量空间模型(Vector Space Model)第23-25页
     ·扩展布尔模型(Extended Boolean Model)第25-26页
     ·模糊集模型(Fuzzy Set Model)第26-27页
第3章 Rough集理论在分类与检索中的应用第27-45页
   ·Rough集理论简介第28-33页
     ·知识表与不可辨关系第28-29页
     ·精确集与Rough集第29-30页
     ·Rough集的近似集第30-31页
     ·Rough度的数学度量第31-32页
     ·决策表第32-33页
     ·决策表属性约简第33页
   ·Rough集理论在自动分类中的应用第33-40页
     ·现有自动分类模型存在的问题第33-35页
     ·自动分类与Rough集的对应第35页
     ·Rough集理论用于分类的优势第35-36页
     ·自动分类中约简算法的选择第36-37页
     ·QR算法及其改进第37-40页
   ·Rough集理论在信息检索中的应用第40-45页
     ·分类与检索在模型上的差别第40-41页
     ·等价关系与容差关系第41-42页
     ·检索中容差关系的判定第42-43页
     ·对象子集的相关度衡量第43页
     ·检索具体步骤第43-45页
第4章 自然语言处理通用模块的设计与实现第45-58页
   ·模块划分与通信第45-47页
   ·规范化处理模块第47页
   ·句、段、标题识别模块第47-48页
   ·分词与词性标注模块第48-51页
     ·自动分词第48-50页
     ·词性标注第50-51页
   ·语义捆绑与特征提取模块第51-56页
     ·统计单元第51-52页
     ·《同义词词林》第52-54页
     ·语义捆绑原则第54-55页
     ·特征提取流程第55-56页
   ·频率统计模块第56页
     ·词频第56页
     ·特征项频率(TF)第56页
     ·反文档频率(IDF)第56页
   ·邻接矩阵构造与计算模块第56-57页
   ·预处理总体流程第57-58页
第5章 自动分类及检索功能的设计与实现第58-69页
   ·分类训练阶段第58-61页
     ·文档矩阵及决策表的构造第58-59页
     ·基于Rough集的特征项约简与加权第59-61页
     ·分类训练阶段流程第61页
   ·分类测试阶段第61-63页
     ·待分类文档预处理第61页
     ·类别隶属度计算第61-62页
     ·分类矩阵调整第62-63页
     ·分类测试阶段流程第63页
   ·分类基础上检索功能的实现第63-69页
     ·预处理第63-64页
     ·字索引第64-65页
     ·词及词位索引第65-66页
     ·特征项邻接矩阵构造第66页
     ·用户查询扩展第66-67页
     ·文档与查询相关度计算第67-69页
第6章 实验结果与分析第69-86页
   ·实验环境第69-70页
     ·语料库第69页
     ·平台第69页
     ·评价标准第69-70页
   ·分类加权算法的实验结果与分析第70-78页
     ·加权算法的选择第70-71页
     ·其它算法的选择第71页
     ·不同加权算法的召回率第71-73页
     ·实验分析第73-78页
   ·分类约简算法的实验结果与分析第78-83页
     ·约简算法的选择第78页
     ·其它算法的选择第78页
     ·Rough集约简算法的约简度第78-79页
     ·Rough集约简效果第79-82页
     ·其它约简算法的约简效果第82页
     ·约简算法的召回率比较第82-83页
   ·IQR算法与QR算法的时间及完备性比较第83-84页
   ·Rough集检索中的结果分布第84页
   ·结论第84-86页
第7章 未来工作展望第86-90页
   ·中间文件格式改进第86-87页
   ·统计与规则的结合第87-88页
   ·实现多级分类第88页
   ·扩充可处理文件格式第88页
   ·实现WWW检索第88-90页
参考文献第90-94页
致   谢第94页
声   明第94-95页
个人简历第95页
攻读硕士学位期间发表的学术论文第95页

论文共95页,点击 下载论文
上一篇:我国出口商品反倾销应诉对策研究
下一篇:关汉卿新论