论文摘要 | 第1-8页 |
Abstract | 第8-11页 |
目录 | 第11-15页 |
1. 绪论 | 第15-22页 |
·研究背景 | 第15-19页 |
·自然语言处理 | 第15-16页 |
·分词 | 第16-19页 |
·本文的研究 | 第19-22页 |
·研究意义 | 第19-20页 |
·研究内容 | 第20-22页 |
2. 相关研究 | 第22-36页 |
·基于统计的自然语言处理 | 第22-29页 |
·上下文无关模型 | 第24页 |
·N-gram模型 | 第24-27页 |
·隐马尔科夫模型 | 第27页 |
·最大熵模型 | 第27-28页 |
·基于决策树的语言模型 | 第28-29页 |
·未登录词识别相关研究 | 第29-36页 |
·未登录词的定义 | 第29-30页 |
·基于规则的未登录词识别研究 | 第30页 |
·基于统计的未登录词研究 | 第30-33页 |
·综合的未登录词研究 | 第33-36页 |
3. 建立语料库 | 第36-39页 |
·语料库的选择 | 第36-38页 |
·语料库的处理方法 | 第38-39页 |
4. 未登录词识别模型的总体设计 | 第39-41页 |
5. 建立上下文无关的未登录词识别模型 | 第41-50页 |
·重复串算法 | 第41-42页 |
·研究步骤 | 第42-44页 |
·实验结果及分析 | 第44-49页 |
·评价函数对未登录词识别的影响 | 第44-45页 |
·选取合适的评价函数和阈值 | 第45-49页 |
·本章小结 | 第49-50页 |
6. 建立上下文相关的未登录词识别模型 | 第50-59页 |
·基于互信息的未登录词识别 | 第50-54页 |
·互信息 | 第50-51页 |
·研究步骤 | 第51页 |
·试验结果分析 | 第51-53页 |
·互信息与词频相结合的未登录词识别 | 第53-54页 |
·基于信息熵的未登录词识别 | 第54-57页 |
·左、右信息熵 | 第54-55页 |
·研究步骤 | 第55-56页 |
·试验结果分析 | 第56-57页 |
·本章小结 | 第57-59页 |
7. 建立基于决策树的未登录词识别模型 | 第59-65页 |
·基于决策树的模型设计 | 第59页 |
·数据挖掘平台 | 第59-60页 |
·实验方法和结果 | 第60-64页 |
·本章小结 | 第64-65页 |
8. 结语 | 第65-66页 |
9. 附录 基于决策树的未登录词模型实验结果输出报告 | 第66-70页 |
参考文献 | 第70-75页 |
后记 | 第75页 |