基于基本层次范畴改进TextRank算法的中文关键词抽取
中文摘要 | 第6-7页 |
Abstract | 第7页 |
1. 绪论 | 第10-16页 |
1.1 选题背景 | 第10页 |
1.2 选题目的及意义 | 第10-11页 |
1.3 研究现状 | 第11-12页 |
1.4 理论方法 | 第12-15页 |
1.4.1 基本层次范畴理论 | 第12-14页 |
1.4.2 语言网络理论 | 第14-15页 |
1.5 语料来源 | 第15-16页 |
2. 改进算法的现实基础及改进方案 | 第16-26页 |
2.1 理论引进的现实基础 | 第16-18页 |
2.1.1 范畴化的层次系统 | 第16-17页 |
2.1.2 层次系统的相对稳定性与差异性 | 第17页 |
2.1.3 基本层次范畴与关键词抽取的关系 | 第17-18页 |
2.2 改进方案 | 第18-21页 |
2.2.1 算法改进的核心思想 | 第18-19页 |
2.2.2 算法的实现方式及流程 | 第19-21页 |
2.3 改进算法的伪代码 | 第21-26页 |
3. 层次化词库的构建 | 第26-45页 |
3.1 基本层次范畴词的选取 | 第26-36页 |
3.1.1 人为判定与计算机处理的冲突 | 第26-27页 |
3.1.2 已有成果的选取策略 | 第27-28页 |
3.1.3 改进后的选取策略 | 第28-30页 |
3.1.4 选取结果及词库层级 | 第30-36页 |
3.2 基础权值的确定 | 第36-45页 |
3.2.1 从“语言问题”到“数学问题” | 第36-38页 |
3.2.2 词同现网络的构建 | 第38-39页 |
3.2.3 选取词在语言网络中的特征 | 第39-42页 |
3.2.4 选取词基础权值的确定 | 第42-44页 |
3.2.5 未收录词的基础权值 | 第44-45页 |
4. 改进算法自测评估 | 第45-56页 |
4.1 评估材料的选取 | 第45-47页 |
4.1.1 选取标准及材料来源 | 第45-46页 |
4.1.2 评估标准 | 第46-47页 |
4.2 抽取效果的评估分析 | 第47-55页 |
4.2.1 科技论文 | 第47-50页 |
4.2.2 网页新闻 | 第50-52页 |
4.2.3 微博语料 | 第52-55页 |
4.3 评估结果 | 第55-56页 |
5. 结论与展望 | 第56-58页 |
参考文献 | 第58-63页 |
附录 | 第63-65页 |
致谢 | 第65页 |