面向微博数据的命名实体识别研究与实现
摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-18页 |
·研究背景及应用 | 第10-11页 |
·研究任务及国内外发展情况 | 第11-12页 |
·中文微博数据上命名实体识别研究的难点 | 第12-14页 |
·中文命名实体识别研究的难点 | 第12-13页 |
·微博数据上命名实体识别研究的难点 | 第13-14页 |
·研究重点及目标 | 第14-15页 |
·文章结构安排 | 第15-18页 |
第2章 命名实体识别相关方法 | 第18-24页 |
·命名实体识别结果的评价 | 第18-19页 |
·基于规则的方法 | 第19页 |
·基于统计的方法 | 第19-22页 |
·隐马尔可夫模型 | 第20-21页 |
·最大熵模型 | 第21-22页 |
·规则和统计相结合的方法 | 第22-23页 |
·tweets上命名实体识别的研究 | 第23页 |
·本章小结 | 第23-24页 |
第3章 基于CRFS模型的命名实体识别 | 第24-34页 |
·图模型 | 第25-27页 |
·有向图模型 | 第25-26页 |
·无向图模型 | 第26-27页 |
·条件随机场 | 第27-29页 |
·CRFs参数估计 | 第29-32页 |
·极大似然估计 | 第29页 |
·迭代缩放法 | 第29-31页 |
·L-BFGS算法 | 第31-32页 |
·模型预测 | 第32-33页 |
·基于CRFs中文命名实体识别 | 第33页 |
·本章小结 | 第33-34页 |
第4章 特征选择 | 第34-44页 |
·字典的建立 | 第34-38页 |
·可用特征 | 第38-41页 |
·当前词特征 | 第39-41页 |
·当前词上下文特征 | 第41页 |
·特征选择 | 第41-42页 |
·微博特征 | 第42-43页 |
·本章小结 | 第43-44页 |
第5章 新浪微博上命名实体识别的实现 | 第44-56页 |
·命名实体识别 | 第45-50页 |
·KNN分类器 | 第46-47页 |
·半监督命名实体识别框架的实现 | 第47-50页 |
·数据规范化 | 第50-51页 |
·实体归一化 | 第51-54页 |
·实体归一化算法 | 第52-53页 |
·实体归一化对命名实体识别结果的修正 | 第53-54页 |
·本章小结 | 第54-56页 |
第6章 实验与结论 | 第56-64页 |
·微博数据获取 | 第56-57页 |
·基于半监督框架的微博上命名实体识别结果 | 第57-60页 |
·数据规范化的结果及影响 | 第60-61页 |
·实体归一化的结果及影响 | 第61-62页 |
·本章小结 | 第62-64页 |
第7章 总结与展望 | 第64-66页 |
·总结 | 第64-65页 |
·展望 | 第65-66页 |
参考文献 | 第66-68页 |
致谢 | 第68页 |