摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第1章 绪论 | 第10-18页 |
1.1 研究背景和意义 | 第10-12页 |
1.1.1 研究背景 | 第10-11页 |
1.1.2 研究意义 | 第11-12页 |
1.2 国内外研究现状综述 | 第12-15页 |
1.2.1 翻译自动评分研究现状 | 第12-13页 |
1.2.2 作文自动评分研究现状 | 第13-14页 |
1.2.3 N-Gram模型研究现状 | 第14-15页 |
1.3 研究内容和目标 | 第15-16页 |
1.4 论文结构 | 第16-18页 |
第2章 相关理论与技术分析 | 第18-30页 |
2.1 N-Gram模型的基本原理 | 第18-21页 |
2.1.1 N-Gram模型的应用 | 第18-19页 |
2.1.2 N-Gram模型的基本原理 | 第19-20页 |
2.1.3 训练N-Gram模型 | 第20-21页 |
2.2 N-Gram模型的平滑 | 第21-27页 |
2.2.1 零概率问题 | 第21-24页 |
2.2.2 拉普拉斯平滑 | 第24-25页 |
2.2.3 卡茨回退 | 第25-26页 |
2.2.4 Kneser-Ney平滑 | 第26-27页 |
2.3 作文自动评分中的特征提取 | 第27-28页 |
2.4 BLEU基本原理 | 第28-29页 |
2.5 本章小结 | 第29-30页 |
第3章 基于N-Gram特征的文本分类 | 第30-42页 |
3.1 算法简介 | 第30-33页 |
3.1.1 Apriori算法基本原理 | 第30-32页 |
3.1.2 朴素贝叶斯算法简介 | 第32-33页 |
3.2 N-Gram文本特征提取 | 第33-35页 |
3.2.1 文本特征表示 | 第33-34页 |
3.2.2 生成N-Gram特征的算法 | 第34-35页 |
3.3 使用N-Gram文本特征进行文本分类 | 第35-40页 |
3.3.1 实验设置 | 第35-36页 |
3.3.2 实验结果 | 第36-39页 |
3.3.3 使用N-Gram特征向量对译文进行分类 | 第39-40页 |
3.4 本章小结 | 第40-42页 |
第4章 构建和维护命名实体识别系统 | 第42-50页 |
4.1 命名实体识别 | 第42-43页 |
4.2 构建命名实体识别系统 | 第43-46页 |
4.2.1 语言预处理 | 第43-44页 |
4.2.2 命名实体检测和分类 | 第44-45页 |
4.2.3 命名实体识别系统的性能测试 | 第45-46页 |
4.3 维持命名实体识别系统 | 第46-49页 |
4.3.1 训练阶段 | 第46-47页 |
4.3.2 部署阶段 | 第47-48页 |
4.3.3 实验结果 | 第48-49页 |
4.4 本章小结 | 第49-50页 |
第5章 构建N-Gram翻译自动评分模型 | 第50-60页 |
5.1 构建语料库和制定评分准则 | 第50-51页 |
5.1.1 构建语料库 | 第50页 |
5.1.2 制定评分准则 | 第50-51页 |
5.2 N-Gram相似性和距离 | 第51-55页 |
5.2.1 Unigram相似性 | 第51-52页 |
5.2.2 N-Gram相似性 | 第52-53页 |
5.2.3 N-Gram距离 | 第53页 |
5.2.4 N-Gram单词相似性度量 | 第53-55页 |
5.3 构建N-Gram评分模型 | 第55-58页 |
5.3.1 确定S_(N-Gram)的计算方法 | 第55-56页 |
5.3.2 确定系数 | 第56页 |
5.3.3 实验结果 | 第56-58页 |
5.4 本章小结 | 第58-60页 |
第6章 总结与展望 | 第60-62页 |
6.1 工作总结 | 第60-61页 |
6.2 未来工作规划 | 第61-62页 |
参考文献 | 第62-66页 |
致谢 | 第66-68页 |
在读期间发表的学术论文与取得的其他研究成果 | 第68页 |