基于超图的汉越新闻关键词抽取研究

摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第11-17页
1.1 选题背景及意义	第11-12页
1.2 国内外研究现状	第12-15页
1.2.1 基于统计的方法	第12-13页
1.2.2 基于机器学习的方法	第13页
1.2.3 基于语言学的方法	第13-14页
1.2.4 多文档关键词抽取研究	第14-15页
1.3 关键词抽取的应用	第15页
1.4 研究内容	第15-16页
1.5 本文组织结构	第16-17页
第二章关键词抽取相关工作	第17-29页
2.1 关键词抽取的概念	第17页
2.2 自然语言处理	第17-18页
2.3 网页预处理	第18-25页
2.3.1 网页去重	第19-20页
2.3.2 网页降噪	第20-22页
2.3.3 中文分词与词性标注	第22-24页
2.3.4 过滤停用词	第24-25页
2.4 超图	第25-29页
第三章基于超图的单文档新闻关键词抽取	第29-37页
3.1 引言	第29页
3.2 基于超图的单文档新闻关键词抽取	第29-30页
3.3 超图模型的特征权重	第30-33页
3.3.1 顶点的特征权重	第30-32页
3.3.2 超边权重计算	第32-33页
3.4 随机游走	第33-35页
3.5 实验与分析	第35-36页
3.5.1 数据集及评价标准	第35页
3.5.2 实验与分析	第35-36页
3.6 本章小结	第36-37页
第四章基于超图的多文档新闻关键词抽取	第37-43页
4.1 引言	第37页
4.2 基于超图的多文档新闻关键词抽取	第37-38页
4.3 超图模型的特征权重	第38-40页
4.3.1 顶点权重计算	第38页
4.3.2 超边权重计算	第38-40页
4.4 实验与分析	第40-41页
4.4.1 数据集及评价标准	第40页
4.4.2 实验与分析	第40-41页
4.5 本章小结	第41-43页
第五章基于超图的汉越新闻关键词抽取	第43-53页
5.1 引言	第43页
5.2 越南语相关研究	第43-44页
5.3 越南语分词和词性标注	第44-45页
5.4 汉越双语新闻超图模型	第45-49页
5.4.1 构造超图	第45-46页
5.4.2 顶点权重计算	第46-48页
5.4.3 超边权重计算	第48-49页
5.5 实验与分析	第49-52页
5.5.1 数据集及评价标准	第49页
5.5.2 实验与分析	第49-52页
5.6 本章小结	第52-53页
第六章总结与展望	第53-55页
6.1 总结	第53页
6.2 展望	第53-55页
致谢	第55-57页
参考文献	第57-63页
附录A (攻读硕士学位期间的学术成果)	第63-65页
附录B (攻读硕士学位期间参与的项目)	第65页