基于关键句的文本自动标签研究
摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第一章 绪论 | 第9-15页 |
1.1 研究背景和意义 | 第9-12页 |
1.2 研究内容 | 第12页 |
1.3 论文结构 | 第12-15页 |
第二章 信息抽取技术概述 | 第15-27页 |
2.1 命名实体识别 | 第15-18页 |
2.1.1 命名实体静态识别 | 第15-16页 |
2.1.2 基于隐马尔科夫的命名实体识别 | 第16-17页 |
2.1.3 基于最大熵的命名实体识别 | 第17页 |
2.1.4 基于条件随机场的命名实体识别 | 第17-18页 |
2.2 自动摘要 | 第18-24页 |
2.2.1 自动摘要早期研究 | 第18-20页 |
2.2.2 基于词频的摘要方法 | 第20-21页 |
2.2.3 基于句子聚类的摘要方法 | 第21-22页 |
2.2.4 基于图的句子排序方法 | 第22页 |
2.2.5 基于机器学习的摘要方法 | 第22-23页 |
2.2.6 自动摘要的一些具体方法 | 第23-24页 |
2.3 自动标签 | 第24-26页 |
2.3.1 利用第三方已有标签关系 | 第25页 |
2.3.2 基于图结构的标签关系 | 第25页 |
2.3.3 协同过滤的标签算法 | 第25-26页 |
2.4 信息抽取系统设计 | 第26-27页 |
第三章 基于CRF的命名实体识别 | 第27-33页 |
3.1 字典方式与CRF方法比较及实现 | 第27-33页 |
第四章 自动摘要算法 | 第33-43页 |
4.1 自动文摘系统流程设计 | 第33页 |
4.2 自动摘要算法 | 第33-40页 |
4.2.1 支持向量机 | 第33-35页 |
4.2.2 关键词选取 | 第35-36页 |
4.2.3 基于关键词密度的特征处理 | 第36-37页 |
4.2.4 结构化信息 | 第37-38页 |
4.2.5 多元特征下的自动摘要系统 | 第38-40页 |
4.3 实验结果及分析 | 第40-43页 |
第五章 自动标签算法 | 第43-55页 |
5.1 自动标签系统设计 | 第43页 |
5.2 自动标签算法 | 第43-50页 |
5.2.1 语料预处理 | 第43-46页 |
5.2.2 中文数据索引的建立 | 第46-48页 |
5.2.3 信息存储 | 第48-49页 |
5.2.4 自动标签算法设计 | 第49-50页 |
5.3 系统设计及实现 | 第50-53页 |
5.4 实验结果及分析 | 第53-55页 |
第六章 总结及展望 | 第55-57页 |
6.1 信息抽取研究总结 | 第55页 |
6.2 不足与展望 | 第55-57页 |
参考文献 | 第57-59页 |
致谢 | 第59-61页 |
作者攻读学位期间发表的学术论文目录 | 第61页 |