基于网络信息的个性化用户词典更新方法
摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第9-17页 |
1.1 课题背景、目的和意义 | 第9-10页 |
1.2 国内外研究现状及分析 | 第10-15页 |
1.2.1 命名实体识别 | 第10-12页 |
1.2.2 新词发现 | 第12-13页 |
1.2.3 词语抽取 | 第13-14页 |
1.2.4 国内外现有的产品 | 第14-15页 |
1.3 本文主要研究内容与组织 | 第15-17页 |
1.3.1 主要研究内容 | 第15-16页 |
1.3.2 本文的组织 | 第16-17页 |
第2章 新词发现的相关技术 | 第17-27页 |
2.1 引言 | 第17页 |
2.2 新词的种类 | 第17-18页 |
2.3 基于规则的新词发现方法 | 第18页 |
2.4 基于统计的新词发现方法 | 第18-22页 |
2.4.1 重复串统计方法 | 第18-20页 |
2.4.2 词语相关度 | 第20-22页 |
2.5 重复串查找算法 | 第22-26页 |
2.5.1 后缀树算法 | 第22-24页 |
2.5.2 BM 算法 | 第24-26页 |
2.6 本章小结 | 第26-27页 |
第3章 语料库的获取以及新词的发现和加载 | 第27-41页 |
3.1 引言 | 第27页 |
3.2 原始网页的获取策略 | 第27-28页 |
3.3 网络信息的提取及净化 | 第28-35页 |
3.4 新词发现以及算法描述 | 第35-39页 |
3.5 词库的个性化加载 | 第39页 |
3.6 本章小结 | 第39-41页 |
第4章 系统实现及实验评测 | 第41-55页 |
4.1 引言 | 第41-42页 |
4.2 新词发现,提取及分类 | 第42-44页 |
4.3 词库在输入法中的加载 | 第44-49页 |
4.4 系统性能测试 | 第49-54页 |
4.4.1 新词提取测试 | 第49-50页 |
4.4.2 新词在输入法的应用中的测试 | 第50-54页 |
4.5 本章小结 | 第54-55页 |
结论 | 第55-56页 |
参考文献 | 第56-62页 |
致谢 | 第62页 |