首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于词语网络的关键词自动提取方法及在中文网页分类中的应用研究

摘要第1-6页
Abstract第6-8页
第一章 绪论第8-15页
   ·论文的选题背景和意义第8-10页
   ·文本关键词自动提取研究现状第10-11页
   ·网页分类研究现状第11-12页
   ·研究内容和创新点第12-14页
     ·中文文本关键词自动提取研究第12-13页
     ·基于关键词特征的中文网页分类研究第13-14页
     ·本文创新点第14页
   ·本文的组织结构第14-15页
第二章 关键词自动提取及分类算法概述第15-28页
   ·关键词自动提取算法分类第15-16页
     ·基于统计的算法第15页
     ·基于词语共现图的算法第15-16页
     ·基于词语网络的算法第16页
   ·基于词语网络的关键词自动提取第16-18页
     ·基本概念第16-17页
     ·词语网络构造第17-18页
   ·词语网络的关键节点选择第18-22页
     ·平均路径长度损失指标第20-21页
     ·路径总损失指标第21-22页
     ·已有关键节点选择算法存在的不足第22页
   ·特征选择算法第22-25页
     ·文档频率第23页
     ·信息增益第23-24页
     ·卡方统计量第24-25页
   ·分类算法介绍第25-28页
     ·k-最近邻法第25页
     ·朴素贝叶斯法第25-28页
第三章 中文文本关键词自动提取第28-38页
   ·基于词语相似度的中文分词第28-32页
     ·词语相似度计算第28-31页
     ·分词算法第31-32页
     ·算法分析第32页
   ·词语网络模型的建立第32-33页
     ·网络节点选择第33页
     ·网络边的生成第33页
   ·基于路径长度与聚类系数加权损失指标选择关键节点第33-36页
     ·平均逆路径长度第33-34页
     ·有效聚类系数第34页
     ·路径长度与聚类系数加权损失指标第34-36页
   ·关键词自动提取算法流程图及性能分析第36-38页
第四章 基于关键词特征网页分类第38-42页
   ·网页内容预处理第38-40页
   ·关键词特征选择第40页
   ·中文网页分类算法第40-42页
第五章 实验与结论第42-49页
   ·实验环境第42页
   ·实验数据第42-43页
   ·实验评价标准第43-45页
     ·分类结果评价第43-44页
     ·关键词提取评价第44-45页
   ·文本关键词自动提取第45-46页
     ·基于相似度分词第45-46页
     ·关键词自动提取第46页
   ·基于关键词分类第46-49页
     ·网页主题内容提取第46-47页
     ·中文网页分类第47-49页
第六章 总结与展望第49-50页
参考文献第50-53页
攻读硕士期间发表的论文第53-54页
致谢第54-55页

论文共55页,点击 下载论文
上一篇:基于Web目录的轻量级本体自动生成
下一篇:基于WBEM系统资源建模和统一管理方案研究