摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第一章 绪论 | 第10-13页 |
·课题研究背景及意义 | 第10-11页 |
·分类器在NLP领域的应用现状 | 第11-12页 |
·本文的工作及内容安排 | 第12-13页 |
第二章 统计分类器概述 | 第13-30页 |
·统计分类器的研究背景及意义 | 第13-15页 |
·数据训练/测试集 | 第15-16页 |
·机器学习的种类 | 第15-16页 |
·统计分类器的训练数据 | 第16页 |
·预处理 | 第16-20页 |
·分词 | 第17-19页 |
·去停用词 | 第19-20页 |
·词干化/词形归并(stemming/lemmatization) | 第20页 |
·常用统计分类器概述 | 第20-26页 |
·统计分类问题描述 | 第20-21页 |
·文档的描述 | 第21-23页 |
·特征选择 | 第23-24页 |
·基本统计分类方法概述 | 第24-26页 |
·分类器性能评价 | 第26页 |
·实验 | 第26-30页 |
·特征选择实验 | 第27页 |
·分类实验 | 第27-30页 |
第三章 实体连接 | 第30-38页 |
·TAC-KBP评测简介 | 第30页 |
·实体连接任务描述 | 第30-31页 |
·实体连接任务解析 | 第31-37页 |
·检索模型 | 第31-32页 |
·分类模型 | 第32-33页 |
·共指消解模型 | 第33-35页 |
·规则模型 | 第35-37页 |
·实验 | 第37-38页 |
第四章 实体聚类 | 第38-55页 |
·WePS评测简介 | 第38页 |
·WePS评测与TAC-KBP评测的关系 | 第38-40页 |
·WePS-1与实体连接的关系 | 第38-39页 |
·WePS-2与实体属性抽取的关系 | 第39页 |
·实体聚类 | 第39-40页 |
·聚类算法概述 | 第40-49页 |
·聚类算法简介 | 第40-41页 |
·样本表示 | 第41页 |
·样本相似性 | 第41-44页 |
·聚类算法 | 第44-49页 |
·数据抽象 | 第49页 |
·聚类评价 | 第49页 |
·实体聚类模型描述 | 第49-54页 |
·模型整体框架 | 第50页 |
·词袋模型 | 第50-51页 |
·强特征模型 | 第51-52页 |
·双阶段模型 | 第52-54页 |
·实验 | 第54-55页 |
第五章 实体属性抽取 | 第55-59页 |
·Slot Filing任务描述 | 第55页 |
·Slot Filling任务解析 | 第55-58页 |
·关系抽取的定义 | 第56页 |
·基于模式匹配的模型 | 第56页 |
·基于机器学习的模型 | 第56-58页 |
·实验 | 第58-59页 |
第六章 总结及展望 | 第59-62页 |
·工作总结 | 第59-60页 |
·下一步工作 | 第60-62页 |
参考文献 | 第62-71页 |
致谢 | 第71-72页 |
附录 | 第72-81页 |
1.朴素Hobbs算法 | 第72-73页 |
2.朴素Hobbs算法示例 | 第73-74页 |
3.简化的朴素Hobbs算法 | 第74-75页 |
4.基于简化的朴素Hobbs算法的文档摘要提取算法 | 第75页 |
5.基于主题共指链的文档摘要提取算法 | 第75页 |
6.特征抽取实验结果1 | 第75-76页 |
7.特征抽取实验结果2 | 第76页 |
8.基于BootStrapping算法的聚类算法 | 第76-77页 |
9.SF中ORG类型实体属性列表 | 第77-79页 |
10.SF中PER类型实体属性列表 | 第79-80页 |
11.域类型 | 第80-81页 |
攻读学位期间发表的学术论文 | 第81页 |