摘要 | 第4-5页 |
abstract | 第5页 |
第一章 绪论 | 第9-15页 |
§1.1 问题的提出 | 第9-11页 |
§1.2 前期工作 | 第11-15页 |
§1.2.1 锚点对齐 | 第11页 |
§1.2.2 Jieba分词技术 | 第11-12页 |
§1.2.3 语料库的创立 | 第12-13页 |
§1.2.4 句对齐 | 第13-14页 |
§1.2.5 中英分词 | 第14-15页 |
第二章 相关理论及技术研究 | 第15-23页 |
§2.1 命名实体识别 | 第15-17页 |
§2.1.1 命名实体识别背景 | 第15-16页 |
§2.1.2 命名实体识别方法 | 第16页 |
§2.1.3 HMM模型 | 第16-17页 |
§2.2 最大熵模型 | 第17-19页 |
§2.3 条件随机场 | 第19-20页 |
§2.3.1 条件随机场介绍 | 第19页 |
§2.3.2 条件随机场(CRF)模型的讲解 | 第19-20页 |
§2.4 ICTCLAS分词技术 | 第20-21页 |
§2.5 中文分词的主要困难 | 第21-23页 |
第三章 系统设计 | 第23-37页 |
§3.1 总体框架设计 | 第23-25页 |
§3.2 建立语料库 | 第25-32页 |
§3.2.1 语料库总体设计 | 第26-28页 |
§3.2.2 具体实施重点模块 | 第28-30页 |
§3.2.3 公式算法 | 第30-31页 |
§3.2.4 断句 | 第31-32页 |
§3.3 构造词典 | 第32-34页 |
§3.3.1 语料的标注 | 第32-33页 |
§3.3.2 特征模板 | 第33页 |
§3.3.3 结果评价 | 第33页 |
§3.3.4 实验结果分析 | 第33-34页 |
§3.4 词典更新 | 第34-36页 |
§3.4.1 英文分词部分 | 第34-35页 |
§3.4.2 中文分词部分 | 第35-36页 |
§3.5 ICTCLAS分词和Jieba分词的区别 | 第36-37页 |
第四章 系统的实现 | 第37-43页 |
§4.1 系统环境 | 第37-38页 |
§4.1.1 Python语言 | 第37-38页 |
§4.1.2 开发的IDE环境 | 第38页 |
§4.2 重点和操作实现 | 第38-40页 |
§4.2.1 总体设计 | 第38页 |
§4.2.2 公式准确率 | 第38-40页 |
§4.3 结果展示 | 第40-43页 |
参考文献 | 第43-46页 |
致谢 | 第46页 |