摘要 | 第4-5页 |
abstract | 第5-6页 |
第一章 绪论 | 第10-15页 |
1.1 课题背景与意义 | 第10页 |
1.2 国内外研究现状 | 第10-12页 |
1.3 本文的主要研究内容 | 第12-13页 |
1.3.1 确定待抽取的人物属性 | 第12页 |
1.3.2 实现不同的抽取方法并比较 | 第12-13页 |
1.3.3 实现机器学习方法的性能优化 | 第13页 |
1.3.4 引入分类,转通用文本到领域内文本 | 第13页 |
1.3.5 设计数据库结构化存储人物信息 | 第13页 |
1.4 论文主要结构 | 第13-15页 |
第二章 相关技术背景介绍 | 第15-20页 |
2.1 属性抽取的分类 | 第15-16页 |
2.1.1 人物属性抽取 | 第15页 |
2.1.2 商品属性抽取 | 第15-16页 |
2.1.3 企业属性抽取 | 第16页 |
2.2 人物属性抽取的关键技术 | 第16-18页 |
2.2.1 命名实体识别 | 第16-17页 |
2.2.2 指代消解 | 第17-18页 |
2.3 页面抽取和页面分析 | 第18页 |
2.4 特征抽取和特征选择 | 第18-19页 |
2.5 本章小结 | 第19-20页 |
第三章 中文人物属性抽取系统设计 | 第20-28页 |
3.1 语料生成模块 | 第20-23页 |
3.1.1 CLP2014中文人物属性抽取任务语料 | 第20-21页 |
3.1.2 百度百科来源语料 | 第21-23页 |
3.2 文本预处理模块 | 第23-25页 |
3.2.1 分词与新词发现 | 第23-24页 |
3.2.2 命名实体识别 | 第24页 |
3.2.3 指代消解 | 第24-25页 |
3.3 属性抽取算法实现模块 | 第25页 |
3.4 后处理模块 | 第25-26页 |
3.5 人物属性数据库设计模块 | 第26-27页 |
3.6 本章小结 | 第27-28页 |
第四章 中文人物属性抽取算法研究 | 第28-46页 |
4.1 中文人物属性抽取研究内容 | 第28-29页 |
4.2 基于规则的中文人物属性抽取 | 第29-32页 |
4.2.1 基本框架 | 第29-30页 |
4.2.2 构建触发词表 | 第30-31页 |
4.2.3 构建属性词典 | 第31页 |
4.2.4 构造人物属性抽取规则 | 第31-32页 |
4.3 基于条件随机场的中文人物属性抽取 | 第32-39页 |
4.3.1 条件随机场理论知识 | 第33-34页 |
4.3.2 特征提取 | 第34-35页 |
4.3.3 文本处理及特征提取举例 | 第35-37页 |
4.3.4 模型训练 | 第37-39页 |
4.4 基于支持向量机的中文人物属性抽取 | 第39-46页 |
4.4.1 支持向量机的理论知识 | 第39-41页 |
4.4.2 多分类SVM | 第41-42页 |
4.4.3 特征提取 | 第42-44页 |
4.4.3.1 传统向量特征 | 第43-44页 |
4.4.3.2 句法树特征 | 第44页 |
4.4.4 模型训练 | 第44-46页 |
第五章 实验测评与优化 | 第46-54页 |
5.1 评价方法 | 第46页 |
5.2 单一模型结果 | 第46-51页 |
5.2.1 基于规则的人物抽取结果 | 第46-47页 |
5.2.2 基于条件随机场的抽取结果 | 第47-50页 |
5.2.2.1 参数优化和特征选择 | 第47-48页 |
5.2.2.2 每个属性单独训练抽取 | 第48-49页 |
5.2.2.3 相关属性联合抽取 | 第49-50页 |
5.2.3 基于支持向量机的抽取结果 | 第50-51页 |
5.2.3.1 传统特征 | 第50页 |
5.2.3.2 增加句法树特征 | 第50-51页 |
5.3 模型的结合 | 第51-52页 |
5.3.1 两个模型结果的交集或并集 | 第51页 |
5.3.2 将一个模型的输出作为另一个模型的某一特征输入 | 第51-52页 |
5.4 领域内人物属性抽取 | 第52页 |
5.5 实验结论 | 第52-54页 |
第六章 中文人物属性抽取的应用系统 | 第54-60页 |
6.1 聊天代理系统简介 | 第54页 |
6.2 聊天代理系统模块设计 | 第54-57页 |
6.2.1 用户交互模块 | 第55-56页 |
6.2.2 自然语言处理模块 | 第56页 |
6.2.3 查询匹配答案模块 | 第56页 |
6.2.4 知识学习模块 | 第56-57页 |
6.3 聊天代理设计原型实现界面 | 第57-60页 |
第七章 总结与展望 | 第60-61页 |
参考文献 | 第61-63页 |
致谢 | 第63页 |