TF-IDF与规则结合的中文关键词自动抽取研究
摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-14页 |
1.1 目的与意义 | 第8-9页 |
1.2 研究现状 | 第9-12页 |
1.2.1 国外现状 | 第10-12页 |
1.2.2 国内现状 | 第12页 |
1.3 本文工作 | 第12-14页 |
2 中文关键词抽取 | 第14-22页 |
2.1 关键词的定义 | 第14页 |
2.2 存在的问题 | 第14-15页 |
2.3 关键词抽取 | 第15-21页 |
2.4 评价标准 | 第21-22页 |
3 未登录词识别 | 第22-40页 |
3.1 相关工作及概念 | 第22-23页 |
3.2 识别方法 | 第23-35页 |
3.2.1 分词 | 第24-25页 |
3.2.2 单词未登录词识别 | 第25-31页 |
3.2.3 多词表达式识别 | 第31-35页 |
3.3 实验 | 第35-40页 |
3.3.1 单词未登录词识别实验 | 第35-38页 |
3.3.2 多词表达式识别实验 | 第38-40页 |
4 关键词抽取 | 第40-52页 |
4.1 候选词选取 | 第40-41页 |
4.1.1 预处理 | 第40-41页 |
4.1.2 候选词过滤 | 第41页 |
4.2 关键词抽取 | 第41-44页 |
4.3 实验与评估 | 第44-52页 |
4.3.1 实验数据 | 第44-46页 |
4.3.2 未登录词对关键词的影响实验 | 第46-48页 |
4.3.3 新闻领域关键词抽取实验 | 第48-50页 |
4.3.4 特定领域关键词抽取实验 | 第50-52页 |
结论 | 第52-54页 |
参考文献 | 第54-58页 |
攻读硕士学位期间发表学术论文情况 | 第58-59页 |
致谢 | 第59-60页 |