基于条件随机场的中文命名实体识别的研究与应用
| 摘要 | 第1-5页 |
| Abstract | 第5-10页 |
| 第1章 绪论 | 第10-16页 |
| ·课题背景以及研究意义 | 第10-12页 |
| ·中文命名实体识别的难点 | 第12-13页 |
| ·国内外相关技术发展现状 | 第13-15页 |
| ·本文主要研究内容 | 第15-16页 |
| 第2章 统计模型 | 第16-34页 |
| ·概率模型 | 第16-17页 |
| ·特征描述 | 第17-20页 |
| ·特征评价准则 | 第17-18页 |
| ·最优特征子集搜索方法 | 第18-19页 |
| ·特征获取方法的选择原则 | 第19-20页 |
| ·条件随机场模型介绍 | 第20-29页 |
| ·引言 | 第20页 |
| ·标记偏见问题 | 第20-22页 |
| ·条件随机场模型定义 | 第22-24页 |
| ·模型参数求解 | 第24-29页 |
| ·条件随机场模型与以往模型的比较 | 第29-33页 |
| ·隐马尔可夫模型的缺点 | 第29-31页 |
| ·最大熵马尔可夫模型的缺点 | 第31-32页 |
| ·最大熵模型的缺点 | 第32页 |
| ·条件随机场的优点及不足 | 第32-33页 |
| ·本章小结 | 第33-34页 |
| 第3章 基于统计的中文命名实体识别 | 第34-67页 |
| ·数据准备 | 第34-36页 |
| ·语料 | 第34-35页 |
| ·各类字典 | 第35-36页 |
| ·试验环境 | 第36页 |
| ·评测指标 | 第36-37页 |
| ·特征构造 | 第37-46页 |
| ·基本特征 | 第39-42页 |
| ·前后缀特征 | 第42页 |
| ·字典特征 | 第42-43页 |
| ·复合特征 | 第43-46页 |
| ·系统结构 | 第46-49页 |
| ·净化模块 | 第46-47页 |
| ·训练模块 | 第47-48页 |
| ·测试模块 | 第48-49页 |
| ·后处理模块 | 第49页 |
| ·基于CRF 模型的试验结果 | 第49-63页 |
| ·无字典特征与有字典特征试验结果 | 第49-51页 |
| ·不同训练字典的试验结果 | 第51-55页 |
| ·后处理结果 | 第55-57页 |
| ·实例分析 | 第57-63页 |
| ·对比 CRFs 和 ME 的识别结果 | 第63-64页 |
| ·对比他人工作 | 第64-66页 |
| ·本章小结 | 第66-67页 |
| 第4章 在线识别以及网络热点人物排名系统 | 第67-72页 |
| ·在线命名实体识别 | 第67页 |
| ·网络热点人物排名 | 第67-71页 |
| ·系统框架 | 第67-68页 |
| ·抓取模块 | 第68页 |
| ·网页净化模块 | 第68-69页 |
| ·识别模块 | 第69页 |
| ·统计模块 | 第69-70页 |
| ·界面模块 | 第70-71页 |
| ·本章小结 | 第71-72页 |
| 结论 | 第72-73页 |
| 参考文献 | 第73-77页 |
| 附录 | 第77-81页 |
| 致谢 | 第81页 |