基于网络资源的未登录词扩展研究
| 摘要 | 第1-4页 |
| Abstract | 第4-6页 |
| 目录 | 第6-8页 |
| 第一章 绪论 | 第8-16页 |
| ·研究背景 | 第8-9页 |
| ·研究意义 | 第9-10页 |
| ·研究现状 | 第10-14页 |
| ·国际研究动态 | 第11页 |
| ·国内研究动态 | 第11-14页 |
| ·论文的研究内容及结构安排 | 第14-16页 |
| ·论文的研究内容 | 第14页 |
| ·论文的研究结构 | 第14-16页 |
| 第二章 中文分词算法 | 第16-30页 |
| ·中文分词算法概述 | 第16-25页 |
| ·基于字符串匹配的分词算法 | 第16-21页 |
| ·基于统计的分词算法 | 第21-24页 |
| ·基于规则的分词算法 | 第24页 |
| ·统计与规则相结合的分词算法 | 第24-25页 |
| ·中文分词的评价标准 | 第25-26页 |
| ·准确率 | 第25页 |
| ·完备性 | 第25-26页 |
| ·可移植性 | 第26页 |
| ·高效性 | 第26页 |
| ·中文分词所面临的困难 | 第26-28页 |
| ·未登录词的识别问题 | 第27页 |
| ·歧义的切分问题 | 第27-28页 |
| ·人机理解与分词的差异性问题 | 第28页 |
| ·分词的评价标准的差异性问题 | 第28页 |
| ·本章小结 | 第28-30页 |
| 第三章 未登录词的识别算法 | 第30-44页 |
| ·未登录词概况介绍 | 第30-31页 |
| ·常用的未登录词识别算法 | 第31-32页 |
| ·基于规则的方法 | 第31页 |
| ·基于统计的方法 | 第31页 |
| ·基于概率统计和规则相结合的方法 | 第31-32页 |
| ·基于统计和规则相结合未登录词识别算法 | 第32-34页 |
| ·统计模型 | 第34-37页 |
| ·数据预处理 | 第34-35页 |
| ·二元语法 | 第35-36页 |
| ·统计算法 | 第36-37页 |
| ·统计选词 | 第37页 |
| ·规则模型 | 第37-41页 |
| ·单字成词规则 | 第38-39页 |
| ·多字成词规则 | 第39-41页 |
| ·实验结果 | 第41-43页 |
| ·本章小结 | 第43-44页 |
| 第四章 未登录词的扩展 | 第44-54页 |
| ·未登录词的扩展识别简介 | 第44页 |
| ·未登录词扩展的相关参数分析 | 第44-48页 |
| ·左右邻信息 | 第44-47页 |
| ·搜索引擎返回摘要个数以及扩展深度 | 第47-48页 |
| ·未登录词的扩展算法 | 第48-53页 |
| ·二元候选未登录词抽取算法 | 第48-49页 |
| ·种子网络资源扩展 | 第49-53页 |
| ·本章小结 | 第53-54页 |
| 第五章 实验与结论 | 第54-60页 |
| ·实验前准备 | 第55-56页 |
| ·切分的概念 | 第55页 |
| ·候选种子 | 第55页 |
| ·未登录词扩展的评价指标 | 第55-56页 |
| ·算法流程 | 第56页 |
| ·实验与分析 | 第56-59页 |
| ·封闭性测试 | 第56-57页 |
| ·开放性测试 | 第57-58页 |
| ·与传统算法比较 | 第58-59页 |
| ·本章小结 | 第59-60页 |
| 第六章 总结与展望 | 第60-62页 |
| ·本文总结 | 第60页 |
| ·未来工作 | 第60-62页 |
| 参考文献 | 第62-66页 |
| 致谢 | 第66-67页 |
| 攻读硕士学位期间发表学术论文目录 | 第67页 |