| 摘要 | 第1-5页 |
| ABSTRACT | 第5-10页 |
| 第一章 绪论 | 第10-13页 |
| ·课题研究背景及意义 | 第10-11页 |
| ·分类器在NLP领域的应用现状 | 第11-12页 |
| ·本文的工作及内容安排 | 第12-13页 |
| 第二章 统计分类器概述 | 第13-30页 |
| ·统计分类器的研究背景及意义 | 第13-15页 |
| ·数据训练/测试集 | 第15-16页 |
| ·机器学习的种类 | 第15-16页 |
| ·统计分类器的训练数据 | 第16页 |
| ·预处理 | 第16-20页 |
| ·分词 | 第17-19页 |
| ·去停用词 | 第19-20页 |
| ·词干化/词形归并(stemming/lemmatization) | 第20页 |
| ·常用统计分类器概述 | 第20-26页 |
| ·统计分类问题描述 | 第20-21页 |
| ·文档的描述 | 第21-23页 |
| ·特征选择 | 第23-24页 |
| ·基本统计分类方法概述 | 第24-26页 |
| ·分类器性能评价 | 第26页 |
| ·实验 | 第26-30页 |
| ·特征选择实验 | 第27页 |
| ·分类实验 | 第27-30页 |
| 第三章 实体连接 | 第30-38页 |
| ·TAC-KBP评测简介 | 第30页 |
| ·实体连接任务描述 | 第30-31页 |
| ·实体连接任务解析 | 第31-37页 |
| ·检索模型 | 第31-32页 |
| ·分类模型 | 第32-33页 |
| ·共指消解模型 | 第33-35页 |
| ·规则模型 | 第35-37页 |
| ·实验 | 第37-38页 |
| 第四章 实体聚类 | 第38-55页 |
| ·WePS评测简介 | 第38页 |
| ·WePS评测与TAC-KBP评测的关系 | 第38-40页 |
| ·WePS-1与实体连接的关系 | 第38-39页 |
| ·WePS-2与实体属性抽取的关系 | 第39页 |
| ·实体聚类 | 第39-40页 |
| ·聚类算法概述 | 第40-49页 |
| ·聚类算法简介 | 第40-41页 |
| ·样本表示 | 第41页 |
| ·样本相似性 | 第41-44页 |
| ·聚类算法 | 第44-49页 |
| ·数据抽象 | 第49页 |
| ·聚类评价 | 第49页 |
| ·实体聚类模型描述 | 第49-54页 |
| ·模型整体框架 | 第50页 |
| ·词袋模型 | 第50-51页 |
| ·强特征模型 | 第51-52页 |
| ·双阶段模型 | 第52-54页 |
| ·实验 | 第54-55页 |
| 第五章 实体属性抽取 | 第55-59页 |
| ·Slot Filing任务描述 | 第55页 |
| ·Slot Filling任务解析 | 第55-58页 |
| ·关系抽取的定义 | 第56页 |
| ·基于模式匹配的模型 | 第56页 |
| ·基于机器学习的模型 | 第56-58页 |
| ·实验 | 第58-59页 |
| 第六章 总结及展望 | 第59-62页 |
| ·工作总结 | 第59-60页 |
| ·下一步工作 | 第60-62页 |
| 参考文献 | 第62-71页 |
| 致谢 | 第71-72页 |
| 附录 | 第72-81页 |
| 1.朴素Hobbs算法 | 第72-73页 |
| 2.朴素Hobbs算法示例 | 第73-74页 |
| 3.简化的朴素Hobbs算法 | 第74-75页 |
| 4.基于简化的朴素Hobbs算法的文档摘要提取算法 | 第75页 |
| 5.基于主题共指链的文档摘要提取算法 | 第75页 |
| 6.特征抽取实验结果1 | 第75-76页 |
| 7.特征抽取实验结果2 | 第76页 |
| 8.基于BootStrapping算法的聚类算法 | 第76-77页 |
| 9.SF中ORG类型实体属性列表 | 第77-79页 |
| 10.SF中PER类型实体属性列表 | 第79-80页 |
| 11.域类型 | 第80-81页 |
| 攻读学位期间发表的学术论文 | 第81页 |