TF-IDF与规则结合的中文关键词自动抽取研究
| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 1 绪论 | 第8-14页 |
| 1.1 目的与意义 | 第8-9页 |
| 1.2 研究现状 | 第9-12页 |
| 1.2.1 国外现状 | 第10-12页 |
| 1.2.2 国内现状 | 第12页 |
| 1.3 本文工作 | 第12-14页 |
| 2 中文关键词抽取 | 第14-22页 |
| 2.1 关键词的定义 | 第14页 |
| 2.2 存在的问题 | 第14-15页 |
| 2.3 关键词抽取 | 第15-21页 |
| 2.4 评价标准 | 第21-22页 |
| 3 未登录词识别 | 第22-40页 |
| 3.1 相关工作及概念 | 第22-23页 |
| 3.2 识别方法 | 第23-35页 |
| 3.2.1 分词 | 第24-25页 |
| 3.2.2 单词未登录词识别 | 第25-31页 |
| 3.2.3 多词表达式识别 | 第31-35页 |
| 3.3 实验 | 第35-40页 |
| 3.3.1 单词未登录词识别实验 | 第35-38页 |
| 3.3.2 多词表达式识别实验 | 第38-40页 |
| 4 关键词抽取 | 第40-52页 |
| 4.1 候选词选取 | 第40-41页 |
| 4.1.1 预处理 | 第40-41页 |
| 4.1.2 候选词过滤 | 第41页 |
| 4.2 关键词抽取 | 第41-44页 |
| 4.3 实验与评估 | 第44-52页 |
| 4.3.1 实验数据 | 第44-46页 |
| 4.3.2 未登录词对关键词的影响实验 | 第46-48页 |
| 4.3.3 新闻领域关键词抽取实验 | 第48-50页 |
| 4.3.4 特定领域关键词抽取实验 | 第50-52页 |
| 结论 | 第52-54页 |
| 参考文献 | 第54-58页 |
| 攻读硕士学位期间发表学术论文情况 | 第58-59页 |
| 致谢 | 第59-60页 |