第一章 前言 | 第1-8页 |
第二章 相关研究简析 | 第8-10页 |
·、 中文文本自动分词和标注 | 第8页 |
·、 新词语自动识别方法研究 | 第8页 |
·、 中文词语通检 | 第8页 |
·、 局部统计在汉语未登录词辨识中的应用和实现方法 | 第8-9页 |
·、 无词典高频字串快速提取和统计算法研究 | 第9页 |
·、 提高汉语自动分词精度的多步处理策略 | 第9页 |
·、 确定切词单位的某些非语法因素 | 第9-10页 |
第三章 系统的构造与实现 | 第10-33页 |
·、 自动分词及提取字串 | 第11-25页 |
·基本流程 | 第11-13页 |
·取段落,取句串 | 第13页 |
·取词串,查底表 | 第13-18页 |
·判断数量结构 | 第18-21页 |
·不可构词字表 | 第21页 |
·处理前串后串 | 第21-24页 |
·结束判断 | 第24-25页 |
·、 频次统计 | 第25页 |
·、 全排列子串重叠过滤 | 第25-27页 |
·全排列子串的定义 | 第25-26页 |
·全排列子串重叠过滤 | 第26-27页 |
·处理结果 | 第27页 |
·、 姓名识别 | 第27-29页 |
·资源 | 第27页 |
·识别方法 | 第27-28页 |
·基本算法 | 第28-29页 |
·运行结果 | 第29页 |
·、 去除噪声字串 | 第29页 |
·、 构词规则 | 第29-33页 |
·内部条件 | 第30页 |
·外部条件 | 第30页 |
·资源 | 第30-31页 |
·规则应用 | 第31页 |
·基本算法 | 第31-33页 |
第四章 实验结果分析 | 第33-36页 |
·、 训练过程 | 第33页 |
·、 测试结果 | 第33-36页 |
·测试语料 | 第33-34页 |
·测试结果 | 第34-35页 |
·召回率分析 | 第35-36页 |
第五章 结束语 | 第36-37页 |
参考文献 | 第37-39页 |
致谢 | 第39-40页 |
附录 | 第40-42页 |