基于聚类分析的中文新闻网页关键词提取方法研究

摘要	第1-6页
Abstract	第6-8页
致谢	第8-13页
第一章绪论	第13-16页
·课题来源	第13页
·课题研究背景和意义	第13页
·本课题的理论处理基础—自然语言处理技术	第13-14页
·本文主要研究内容及组织结构	第14-16页
第二章关键词提取背景及相关工作	第16-31页
·引言	第16页
·关键词概念	第16-17页
·语言学背景知识—自然语言处理技术	第17-19页
·自然语言处理概述	第17页
·自然语言处理的研究方法	第17-19页
·聚类分析	第19-27页
·聚类分析概述	第19-22页
·聚类分析中的数据类型	第22-25页
·主要聚类方法概述	第25-27页
·互联网关键词提取技术研究现状	第27-30页
·网页中文本关键词提取技术	第28页
·网页信息提取的评价指标	第28-29页
·文本主题词的提取研究现状	第29-30页
·本章小结	第30-31页
第三章基于层次聚类的中文新闻网页关键词提取的研究	第31-39页
·引言	第31-32页
·语义相似度	第32-33页
·候选关键词	第33页
·聚类距离的计算	第33-34页
·基于层次聚类的中文新闻网页关键词提取算法	第34-35页
·实验与评价	第35-38页
·测试集与评价标准	第35页
·语义相似度阂值的设定	第35-36页
·实验与评价	第36-38页
·本章小结	第38-39页
第四章基于密度聚类的中文新闻网页关键词提取研究	第39-48页
·引言	第39页
·词共现模型	第39-40页
·算法步骤描述	第40-43页
·算法流程	第40-41页
·算法步骤描述	第41-42页
·算法图示说明	第42-43页
·实验与评价	第43-47页
·词共现阈值对实验结果的影响	第43页
·实验结果分析	第43-47页
·本章小结	第47-48页
第五章结束语	第48-50页
·本文总结	第48-49页
·工作展望	第49-50页
参考文献	第50-54页
攻读硕士学位期间参加研究的课题和发表的论文	第54页