首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于组合特征的中文新闻网页关键词提取研究

摘要第1-5页
ABSTRACT第5-8页
1 引言第8-13页
   ·研究目的与意义第8页
   ·关键词提取的研究现状第8-11页
   ·本文研究内容第11-12页
   ·本文组织结构第12-13页
2 关键词提取相关理论第13-24页
   ·关键词提取的概念第13页
   ·自然语言处理第13-16页
   ·网页内容提取第16-20页
     ·HTML介绍第16-17页
     ·网页内容提取原理第17-19页
     ·常见网页内容提取方法第19-20页
   ·中文分词技术第20-21页
   ·常见关键词提取方法第21-23页
   ·小结第23-24页
3 组合词生成相关理论第24-27页
   ·组合词的概念第24页
   ·组合词与新词识别第24-25页
   ·组合词生成方法第25-26页
     ·基于统计的方法第25页
     ·基于规则的方法第25页
     ·统计和规则结合的方法第25-26页
   ·小结第26-27页
4 基于组合特征的新闻网页关键词提取方法设计第27-34页
   ·网页预处理第27页
   ·分词及词性标注第27-28页
   ·停用词过滤第28页
   ·特征选取第28-30页
     ·词频第28-29页
     ·词长第29页
     ·词性第29页
     ·首次出现位置第29-30页
     ·词跨度第30页
   ·组合词生成第30-33页
   ·候选词去重合并第33页
   ·小结第33-34页
5 实验结果与分析第34-42页
   ·实验准备第34页
     ·实验环境第34页
     ·数据集第34页
   ·验证性实验第34-37页
     ·网页预处理实验第34-35页
     ·分词和词性标注实验第35-36页
     ·候选关键词提取实验第36-37页
   ·对比实验第37-40页
   ·参数敏感性分析第40-41页
   ·小结第41-42页
6 总结与展望第42-44页
   ·总结第42页
   ·展望第42-44页
参考文献第44-48页
个人简介第48-49页
导师简介第49-50页
获得成果目录清单第50-51页
致谢第51页

论文共51页,点击 下载论文
上一篇:林业WEB黄页信息整合中数据去重关键技术研究
下一篇:基于点击日志的搜索引擎用户满意度评价研究