基于网络资源的未登录词扩展研究
摘要 | 第1-4页 |
Abstract | 第4-6页 |
目录 | 第6-8页 |
第一章 绪论 | 第8-16页 |
·研究背景 | 第8-9页 |
·研究意义 | 第9-10页 |
·研究现状 | 第10-14页 |
·国际研究动态 | 第11页 |
·国内研究动态 | 第11-14页 |
·论文的研究内容及结构安排 | 第14-16页 |
·论文的研究内容 | 第14页 |
·论文的研究结构 | 第14-16页 |
第二章 中文分词算法 | 第16-30页 |
·中文分词算法概述 | 第16-25页 |
·基于字符串匹配的分词算法 | 第16-21页 |
·基于统计的分词算法 | 第21-24页 |
·基于规则的分词算法 | 第24页 |
·统计与规则相结合的分词算法 | 第24-25页 |
·中文分词的评价标准 | 第25-26页 |
·准确率 | 第25页 |
·完备性 | 第25-26页 |
·可移植性 | 第26页 |
·高效性 | 第26页 |
·中文分词所面临的困难 | 第26-28页 |
·未登录词的识别问题 | 第27页 |
·歧义的切分问题 | 第27-28页 |
·人机理解与分词的差异性问题 | 第28页 |
·分词的评价标准的差异性问题 | 第28页 |
·本章小结 | 第28-30页 |
第三章 未登录词的识别算法 | 第30-44页 |
·未登录词概况介绍 | 第30-31页 |
·常用的未登录词识别算法 | 第31-32页 |
·基于规则的方法 | 第31页 |
·基于统计的方法 | 第31页 |
·基于概率统计和规则相结合的方法 | 第31-32页 |
·基于统计和规则相结合未登录词识别算法 | 第32-34页 |
·统计模型 | 第34-37页 |
·数据预处理 | 第34-35页 |
·二元语法 | 第35-36页 |
·统计算法 | 第36-37页 |
·统计选词 | 第37页 |
·规则模型 | 第37-41页 |
·单字成词规则 | 第38-39页 |
·多字成词规则 | 第39-41页 |
·实验结果 | 第41-43页 |
·本章小结 | 第43-44页 |
第四章 未登录词的扩展 | 第44-54页 |
·未登录词的扩展识别简介 | 第44页 |
·未登录词扩展的相关参数分析 | 第44-48页 |
·左右邻信息 | 第44-47页 |
·搜索引擎返回摘要个数以及扩展深度 | 第47-48页 |
·未登录词的扩展算法 | 第48-53页 |
·二元候选未登录词抽取算法 | 第48-49页 |
·种子网络资源扩展 | 第49-53页 |
·本章小结 | 第53-54页 |
第五章 实验与结论 | 第54-60页 |
·实验前准备 | 第55-56页 |
·切分的概念 | 第55页 |
·候选种子 | 第55页 |
·未登录词扩展的评价指标 | 第55-56页 |
·算法流程 | 第56页 |
·实验与分析 | 第56-59页 |
·封闭性测试 | 第56-57页 |
·开放性测试 | 第57-58页 |
·与传统算法比较 | 第58-59页 |
·本章小结 | 第59-60页 |
第六章 总结与展望 | 第60-62页 |
·本文总结 | 第60页 |
·未来工作 | 第60-62页 |
参考文献 | 第62-66页 |
致谢 | 第66-67页 |
攻读硕士学位期间发表学术论文目录 | 第67页 |