数学学术文献自然语言处理中的若干问题

摘要	第4-5页
abstract	第5页
第一章绪论	第9-15页
§1.1 问题的提出	第9-11页
§1.2 前期工作	第11-15页
§1.2.1 锚点对齐	第11页
§1.2.2 Jieba分词技术	第11-12页
§1.2.3 语料库的创立	第12-13页
§1.2.4 句对齐	第13-14页
§1.2.5 中英分词	第14-15页
第二章相关理论及技术研究	第15-23页
§2.1 命名实体识别	第15-17页
§2.1.1 命名实体识别背景	第15-16页
§2.1.2 命名实体识别方法	第16页
§2.1.3 HMM模型	第16-17页
§2.2 最大熵模型	第17-19页
§2.3 条件随机场	第19-20页
§2.3.1 条件随机场介绍	第19页
§2.3.2 条件随机场(CRF)模型的讲解	第19-20页
§2.4 ICTCLAS分词技术	第20-21页
§2.5 中文分词的主要困难	第21-23页
第三章系统设计	第23-37页
§3.1 总体框架设计	第23-25页
§3.2 建立语料库	第25-32页
§3.2.1 语料库总体设计	第26-28页
§3.2.2 具体实施重点模块	第28-30页
§3.2.3 公式算法	第30-31页
§3.2.4 断句	第31-32页
§3.3 构造词典	第32-34页
§3.3.1 语料的标注	第32-33页
§3.3.2 特征模板	第33页
§3.3.3 结果评价	第33页
§3.3.4 实验结果分析	第33-34页
§3.4 词典更新	第34-36页
§3.4.1 英文分词部分	第34-35页
§3.4.2 中文分词部分	第35-36页
§3.5 ICTCLAS分词和Jieba分词的区别	第36-37页
第四章系统的实现	第37-43页
§4.1 系统环境	第37-38页
§4.1.1 Python语言	第37-38页
§4.1.2 开发的IDE环境	第38页
§4.2 重点和操作实现	第38-40页
§4.2.1 总体设计	第38页
§4.2.2 公式准确率	第38-40页
§4.3 结果展示	第40-43页
参考文献	第43-46页
致谢	第46页