基于组合特征的中文新闻网页关键词提取研究

摘要	第1-5页
ABSTRACT	第5-8页
1 引言	第8-13页
·研究目的与意义	第8页
·关键词提取的研究现状	第8-11页
·本文研究内容	第11-12页
·本文组织结构	第12-13页
2 关键词提取相关理论	第13-24页
·关键词提取的概念	第13页
·自然语言处理	第13-16页
·网页内容提取	第16-20页
·HTML介绍	第16-17页
·网页内容提取原理	第17-19页
·常见网页内容提取方法	第19-20页
·中文分词技术	第20-21页
·常见关键词提取方法	第21-23页
·小结	第23-24页
3 组合词生成相关理论	第24-27页
·组合词的概念	第24页
·组合词与新词识别	第24-25页
·组合词生成方法	第25-26页
·基于统计的方法	第25页
·基于规则的方法	第25页
·统计和规则结合的方法	第25-26页
·小结	第26-27页
4 基于组合特征的新闻网页关键词提取方法设计	第27-34页
·网页预处理	第27页
·分词及词性标注	第27-28页
·停用词过滤	第28页
·特征选取	第28-30页
·词频	第28-29页
·词长	第29页
·词性	第29页
·首次出现位置	第29-30页
·词跨度	第30页
·组合词生成	第30-33页
·候选词去重合并	第33页
·小结	第33-34页
5 实验结果与分析	第34-42页
·实验准备	第34页
·实验环境	第34页
·数据集	第34页
·验证性实验	第34-37页
·网页预处理实验	第34-35页
·分词和词性标注实验	第35-36页
·候选关键词提取实验	第36-37页
·对比实验	第37-40页
·参数敏感性分析	第40-41页
·小结	第41-42页
6 总结与展望	第42-44页
·总结	第42页
·展望	第42-44页
参考文献	第44-48页
个人简介	第48-49页
导师简介	第49-50页
获得成果目录清单	第50-51页
致谢	第51页