首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于关键词的Web文档自动分类算法研究

摘要第1-6页
Abstract第6-7页
致谢第7-12页
第一章 绪论第12-16页
   ·Web文档分类概述第12页
   ·国内外研究动态第12-13页
   ·主要研究内容第13-14页
   ·课题来源和内容组织第14-16页
     ·课题来源第14-15页
     ·内容安排第15-16页
第二章 Web文档分类关键技术第16-27页
   ·分类系统功能模块第16页
   ·文本线性化第16-20页
     ·向量空间模型的基本概念第17-18页
     ·特征项的选择第18-19页
     ·候选词权重计算第19-20页
   ·中文分词方法第20-22页
   ·特征词选取第22-25页
     ·文档频度法第23页
     ·信息增益值法第23页
     ·X~2统计法第23-24页
     ·相关信息量第24页
     ·期望相关信息量第24页
     ·特征选取法的比较第24-25页
   ·文本分类器比较第25页
   ·评估方法第25-26页
     ·F-measure第25-26页
     ·熵(Entropy)第26页
   ·本章小结第26-27页
第三章 基于语义相似度的关键词提取第27-40页
   ·文档结构分析第27-28页
   ·候选词抽取第28-30页
     ·文档预处理第29页
     ·特征词的权重第29-30页
     ·候选词过滤第30页
   ·词语相似度计算第30-32页
   ·特征词消歧第32-34页
     ·词义消歧第32-33页
     ·贝叶斯词义消歧第33-34页
   ·词汇链构建第34-36页
     ·词汇关联规则第34-35页
     ·构建词汇链的算法第35-36页
   ·关键词提取第36-39页
     ·研究现状第36-37页
     ·算法描述第37页
     ·评估方法第37-38页
     ·试验结果第38-39页
   ·本章小结第39-40页
第四章 基于关键词的文档聚类分类模型第40-48页
   ·最小生成树聚类性质第40-41页
   ·自切割合并聚类算法第41-42页
   ·文本之间相似度计算第42-43页
   ·基于语义的自切割合并聚类算法第43-44页
   ·Web文档聚类模型第44-45页
   ·聚类实验和结果讨论第45-47页
   ·本章小结第47-48页
第五章 总结和展望第48-50页
   ·本课题的研究成果第48页
   ·进一步研究的设想第48-50页
参考文献第50-55页
附录一 研究生期间主要科研工作及成果第55页

论文共55页,点击 下载论文
上一篇:基于LiDAR点云和航空影像的城市三维重建
下一篇:双燃料发动机燃气系统软件设计及PID控制策略研究