N-gram技术在中文词法分析中的应用研究
| 摘要 | 第1-6页 |
| Abstract | 第6-10页 |
| 引言 | 第10-14页 |
| ·中文信息处理的研究现状 | 第10-11页 |
| ·N-GRAM模型及其在中文信息处理中的应用现状 | 第11-12页 |
| ·论文研究内容 | 第12页 |
| ·论文章节安排 | 第12-14页 |
| 1 中文信息处理 | 第14-21页 |
| ·中文信息处理的分类 | 第14页 |
| ·中文信息处理的基本方法 | 第14-15页 |
| ·中文信息处理的发展状况 | 第15-21页 |
| 2 N-GRAM 模型及其在词法分析中的应用 | 第21-28页 |
| ·词法分析 | 第21-23页 |
| ·国内外相关研究 | 第22页 |
| ·中文词法分析的特点及其困难 | 第22-23页 |
| ·强化学习方法 | 第23页 |
| ·简述N-GRAM模型 | 第23-26页 |
| ·N-GRAM模型的关键问题 | 第26-28页 |
| 3 词法分析中的中文分词 | 第28-37页 |
| ·研究现状 | 第28-31页 |
| ·国内研究现状 | 第28-30页 |
| ·国际研究现状 | 第30-31页 |
| ·N-GRAM中文分词模型 | 第31-32页 |
| ·中文分词中亟需解决的问题 | 第32-33页 |
| ·中文分词的性能评价指标 | 第33-34页 |
| ·分词系统的实验评测 | 第34-35页 |
| ·基于词语级别的N-gram 模型切分评测 | 第34-35页 |
| ·基于N-GRAM模板的语言特征表示 | 第35-37页 |
| 4 基于N-GRAM 的新词识别 | 第37-46页 |
| ·单词序列的概率模型 | 第38-40页 |
| ·N-GRAM 算法识别新词的设计思路 | 第40-43页 |
| ·语料库的准备 | 第40页 |
| ·N-gram 模型与字出现概率的计算 | 第40-43页 |
| ·新词识别实验 | 第43-46页 |
| 5 结束语 | 第46-48页 |
| ·总结本文工作 | 第46页 |
| ·下一步工作展望 | 第46-48页 |
| 参考文献 | 第48-50页 |
| 附录 | 第50-64页 |
| 致谢 | 第64-65页 |
| 个人简历、在学期间发表的学术论文与研究成果 | 第65页 |