微博对话链的命名实体识别技术研究与实现
| 摘要 | 第8-9页 |
| ABSTRACT | 第9页 |
| 第一章 绪论 | 第10-18页 |
| 1.1 研究背景和意义 | 第10-11页 |
| 1.2 微博命名实体识别任务描述 | 第11-13页 |
| 1.3 国内外研究现状 | 第13-16页 |
| 1.3.1 命名实体识别研究现状 | 第13-14页 |
| 1.3.2 微博文本命名实体识别研究难点 | 第14-16页 |
| 1.4 本文研究内容 | 第16页 |
| 1.5 本文组织结构 | 第16-18页 |
| 第二章 相关研究工作 | 第18-28页 |
| 2.1 命名实体识别相关技术 | 第18-21页 |
| 2.1.1 基于规则的技术 | 第18页 |
| 2.1.2 基于统计的技术 | 第18-21页 |
| 2.1.3 规则和统计相结合的技术 | 第21页 |
| 2.2 条件随机场 | 第21-24页 |
| 2.2.1 概率图模型概述 | 第21-22页 |
| 2.2.2 条件随机场模型 | 第22-24页 |
| 2.2.3 条件随机场模型在命名实体识别中的应用 | 第24页 |
| 2.3 微博数据获取相关技术 | 第24-27页 |
| 2.3.1 微博开放平台 | 第25-26页 |
| 2.3.2 网络爬虫和HTML页面解析技术 | 第26-27页 |
| 2.4 本章小结 | 第27-28页 |
| 第三章 获取微博数据与构建微博对话链 | 第28-38页 |
| 3.1 微博对话链 | 第28-29页 |
| 3.2 博文和评论的获取 | 第29-34页 |
| 3.2.1 微博数据的获取 | 第30-31页 |
| 3.2.2 评论数据的获取 | 第31-34页 |
| 3.3 微博对话链的构建方法 | 第34-36页 |
| 3.3.1 微博数据预处理 | 第34-35页 |
| 3.3.2 评论的筛选 | 第35-36页 |
| 3.3.3 微博对话链的构建 | 第36页 |
| 3.4 本章小结 | 第36-38页 |
| 第四章 基于角色特征和CRFs模型的命名实体识别 | 第38-48页 |
| 4.1 人名、地名、组织名角色 | 第38-40页 |
| 4.2 角色标注 | 第40-41页 |
| 4.3 特征集与特征模板 | 第41-46页 |
| 4.3.1 字特征与特征模板 | 第42-43页 |
| 4.3.2 角色特征与特征模板 | 第43页 |
| 4.3.3 组合特征与特征模板 | 第43-46页 |
| 4.4 微博对话链命名实体识别技术的实现 | 第46-47页 |
| 4.5 本章小结 | 第47-48页 |
| 第五章 实验与结论 | 第48-57页 |
| 5.1 实验数据的准备 | 第48-51页 |
| 5.1.1 标注集 | 第48页 |
| 5.1.2 CRF++工具简介 | 第48-51页 |
| 5.2 评价指标 | 第51页 |
| 5.3 微博对话链的命名实体识别实验 | 第51-52页 |
| 5.4 微博对话链对命名实体识别结果的影响 | 第52-54页 |
| 5.5 角色特征对命名实体识别结果的影响 | 第54-55页 |
| 5.6 数据集大小对命名实体识别结果的影响 | 第55页 |
| 5.7 本章小结 | 第55-57页 |
| 第六章 总结与展望 | 第57-59页 |
| 6.1 总结 | 第57-58页 |
| 6.2 展望 | 第58-59页 |
| 致谢 | 第59-60页 |
| 参考文献 | 第60-63页 |
| 作者在学期间取得的学术成果 | 第63页 |