关键词抽取的研究与实现
摘要 | 第1-9页 |
ABSTRACT | 第9-10页 |
第一章 绪论 | 第10-15页 |
·概述 | 第10-11页 |
·关键词的应用 | 第11页 |
·关键词抽取面临的主要问题 | 第11-13页 |
·本文主要工作 | 第13页 |
·本文结构 | 第13-15页 |
第二章 相关方法介绍 | 第15-22页 |
·关键词抽取与相关任务比较 | 第15-16页 |
·关键词抽取与自动摘要 | 第15页 |
·关键词抽取与信息抽取 | 第15-16页 |
·关键词抽取与自动索引 | 第16页 |
·关键词抽取研究现状 | 第16-21页 |
·关键词抽取中“关键”问题研究现状 | 第16-19页 |
·关键词抽取中“词”问题研究现状 | 第19-21页 |
·小结 | 第21-22页 |
第三章 关键词分类问题 | 第22-24页 |
·关键单词的定义 | 第22页 |
·关键词串的定义 | 第22-23页 |
·小结 | 第23-24页 |
第四章 基于分离模型的关键词抽取算法 | 第24-32页 |
·分离模型的构造 | 第24-26页 |
·候选关键单词与候选关键词串的生成 | 第26-27页 |
·英文中候选关键单词与候选关键词短语的生成 | 第26-27页 |
·中文中候选关键单词与候选关键词短语的生成 | 第27页 |
·模型的训练与SVM 学习器 | 第27-29页 |
·关键词的抽取 | 第29-31页 |
·小结 | 第31-32页 |
第五章 分离模型的特征设计 | 第32-41页 |
·关键单词与关键词串公共特征设计 | 第32-35页 |
·TF×IDF 特征 | 第32-33页 |
·首次出现位置特征POS | 第33-34页 |
·TF×IF 特征 | 第34-35页 |
·文档长度特征NWT | 第35页 |
·关键单词特征设计 | 第35-36页 |
·关键词串特征设计 | 第36-39页 |
·互信息特征 | 第36-37页 |
·词串边界参数表特征 | 第37-38页 |
·候选关键词串结尾词词性特征 | 第38页 |
·候选关键词串开头词词性特征 | 第38页 |
·候选关键词串非结尾词中非形容词非名词的数目 | 第38页 |
·候选关键词串所含词数 | 第38-39页 |
·小结 | 第39-41页 |
第六章 实验与分析 | 第41-55页 |
·实验方法 | 第41-42页 |
·分类实验 | 第41-42页 |
·评分实验 | 第42页 |
·语料介绍 | 第42页 |
·分离模型与整体模型比较 | 第42-48页 |
·英文中分离模型与整体模型比较 | 第42-45页 |
·中文中分离模型与整体模型比较 | 第45-48页 |
·关键单词特征与关键词串特征的作用 | 第48-52页 |
·英文中关键单词特征与关键词短语特征实验 | 第48-50页 |
·中文中关键单词特征与关键词串特征实验 | 第50-52页 |
·与KEA 的比较实验 | 第52-54页 |
·与KEA 在英文关键词抽取上的比较 | 第52-53页 |
·与KEA 在中文关键词抽取中的比较 | 第53-54页 |
·小结 | 第54-55页 |
第七章 结束语 | 第55-56页 |
致谢 | 第56-57页 |
参考文献 | 第57-61页 |
作者在学期间取得的学术成果 | 第61页 |