中文摘要 | 第1-5页 |
英文摘要 | 第5-8页 |
1 绪论 | 第8-12页 |
·本文研究的背景及意义 | 第8-9页 |
·研究背景 | 第8页 |
·研究意义 | 第8-9页 |
·国内外研究现状 | 第9-11页 |
·汉语自动分词的研究现状 | 第9-10页 |
·汉语自动分词的难点 | 第10-11页 |
·本文研究的目的和研究内容 | 第11-12页 |
·本文研究目的 | 第11页 |
·本文研究主要内容 | 第11-12页 |
2 汉语自动分词 | 第12-25页 |
·引言 | 第12-13页 |
·汉语自动分词概述 | 第13-15页 |
·汉语自动分词的现实性和可行性 | 第13页 |
·汉语自动分词的性能评价 | 第13-14页 |
·几种典型分词系统的评介 | 第14-15页 |
·语言模型 | 第15-20页 |
·N-gram 模型 | 第16-17页 |
·HMM 模型 | 第17-19页 |
·基于HMM 模型的汉语自动分词词性标注一体化模型 | 第19-20页 |
·语言模型数据稀疏问题 | 第20页 |
·汉语自动分词基本算法 | 第20-23页 |
·基于规则的分词算法 | 第21-22页 |
·基于统计的分词算法 | 第22页 |
·统计和规则相结合的分词算法 | 第22-23页 |
·汉语自动分词的难点和特点 | 第23-24页 |
·分词规范的困难 | 第23页 |
·歧义切分字段 | 第23-24页 |
·未登录词识别 | 第24页 |
·本章小结 | 第24-25页 |
3 时间语词消歧算法研究 | 第25-33页 |
·引言 | 第25页 |
·时间语词切分歧义的概念及研究意义 | 第25-26页 |
·基于词性信息的时间语词消歧算法 | 第26-28页 |
·基于词性信息区分时点和时段的模型 | 第26-28页 |
·时间语词消歧算法 | 第28页 |
·实验结果及算法改进 | 第28-32页 |
·实验步骤 | 第28-29页 |
·实验结果 | 第29-30页 |
·对基于词性信息的时间语词消歧算法的改进 | 第30-32页 |
·本章小结 | 第32-33页 |
4 系统的设计与实现 | 第33-46页 |
·引言 | 第33页 |
·系统流程图和核心功能模块 | 第33-38页 |
·系统流程图 | 第33-34页 |
·核心功能模块及其功能 | 第34-38页 |
·系统的实现 | 第38-45页 |
·开发工具选择 | 第38-40页 |
·语言资源库建设 | 第40-42页 |
·断句及初切分模块的实现 | 第42-45页 |
·系统集成 | 第45页 |
·本章小结 | 第45-46页 |
5 性能测试、实验结果 | 第46-51页 |
·系统界面及功能 | 第46-47页 |
·分词速度测试 | 第47-49页 |
·分词精度测试 | 第49-50页 |
·结论 | 第50-51页 |
6 结论与展望 | 第51-52页 |
·主要结论 | 第51页 |
·后续研究工作的展望 | 第51-52页 |
致谢 | 第52-53页 |
参考文献 | 第53-56页 |
附录:作者在攻读硕士学位期间的其他工作 | 第56-57页 |
独创性声明 | 第57页 |
学位论文版权使用授权书 | 第57页 |