基于CRF模型的银行交易短信信息数据标注研究
摘要 | 第4-6页 |
Abstract | 第6-8页 |
第一章 绪论 | 第11-19页 |
1.1 选题背景 | 第11-13页 |
1.1.1 移动互联网与大数据 | 第11页 |
1.1.2 短信数据的功能 | 第11-12页 |
1.1.3 自然语言处理 | 第12页 |
1.1.4 短信提取现状及问题 | 第12-13页 |
1.2 研究目的和意义 | 第13-14页 |
1.2.1 研究目的 | 第13页 |
1.2.2 选题意义 | 第13-14页 |
1.3 研究内容、方法和技术路线 | 第14-18页 |
1.3.1 研究内容 | 第14-15页 |
1.3.2 研究方法 | 第15-17页 |
1.3.3 技术路线 | 第17-18页 |
1.4 本文主要贡献 | 第18-19页 |
第二章 文献综述和相关理论 | 第19-35页 |
2.1 文献综述 | 第19-23页 |
2.1.1 国外研究现状 | 第19-22页 |
2.1.2 国内研究现状 | 第22-23页 |
2.1.3 相关文献述评 | 第23页 |
2.2 相关理论 | 第23-35页 |
2.2.1 中文分词的研究 | 第23-27页 |
2.2.2 CRF模型 | 第27-35页 |
第三章 特征模板构建、数据、及评价标准 | 第35-45页 |
3.1 特征模板构建 | 第35-41页 |
3.1.1 特征函数与状态特征关系 | 第35页 |
3.1.2 特征模板定义 | 第35-36页 |
3.1.3 字符分割系统特征模板构建 | 第36-38页 |
3.1.4 命名实例系统特征模板构建 | 第38-41页 |
3.2 论文实验数据集 | 第41-44页 |
3.2.1 中文分词和词性标注数据集 | 第42页 |
3.2.2 命名实例标注 | 第42-44页 |
3.3 结论评价标准 | 第44-45页 |
第四章 CRF行业短信信息抽取实验过程及结果分析 | 第45-52页 |
4.1 基于CRF的短信短语分词系统及结果分析 | 第45-48页 |
4.1.1 短语分词系统实验过程及分析 | 第45-46页 |
4.1.2 分词系统结果及分析 | 第46-48页 |
4.2 基于CRF的命名实例识别系统及结果分析 | 第48-52页 |
4.2.1 实验过程及结果分析 | 第48-49页 |
4.2.2 实例提取系统结果及分析 | 第49-52页 |
第五章 结论及研究展望 | 第52-54页 |
参考文献 | 第54-59页 |
附录 | 第59-68页 |
致谢 | 第68页 |