基于Web语料的中英文词典生成方法研究
| 摘要 | 第1-7页 |
| Abstract | 第7-9页 |
| 目录 | 第9-11页 |
| Contents | 第11-13页 |
| 第1章 绪论 | 第13-21页 |
| ·研究背景和意义 | 第13-14页 |
| ·国内外研究现状 | 第14-15页 |
| ·相关理论和技术 | 第15-17页 |
| ·基于 Web 的信息抽取技术 | 第15-17页 |
| ·双语词对齐技术 | 第17页 |
| ·本文的主要工作及创新点 | 第17-18页 |
| ·本文结构 | 第18-21页 |
| 第2章 基于 Web 的翻译抽取与验证思路 | 第21-25页 |
| ·中英文翻译抽取面临的主要问题 | 第21页 |
| ·本文研究思路与系统流程 | 第21-24页 |
| ·本章小结 | 第24-25页 |
| 第3章 Web 语料抓取和预处理 | 第25-39页 |
| ·Web 中翻译存在的形式 | 第25-27页 |
| ·基于正则表达式的 Web 信息抽取 | 第27-29页 |
| ·正则表达式 | 第28-29页 |
| ·语料抓取的正则表示 | 第29页 |
| ·基于谓词表达式演变的语料过滤系统 | 第29-34页 |
| ·谓词表达式 | 第29-31页 |
| ·过滤规则 | 第31-34页 |
| ·语料分类与二次过滤 | 第34-37页 |
| ·本章小结 | 第37-39页 |
| 第4章 中英文翻译提取模型 | 第39-51页 |
| ·传统提取方法分析 | 第39-40页 |
| ·翻译提取模型介绍 | 第40-41页 |
| ·基于形式的翻译提取方法 | 第41-42页 |
| ·基于统计的翻译提取方法 | 第42-50页 |
| ·基于概率变化率的翻译提取方法 | 第44-46页 |
| ·基于汉字信息熵的翻译提取方法 | 第46-48页 |
| ·基于词组凝聚度变化率的翻译提取方法 | 第48-50页 |
| ·本章小结 | 第50-51页 |
| 第5章 中英文翻译优化与词典生成 | 第51-57页 |
| ·中英文翻译错误类型分析 | 第51-53页 |
| ·英文拼写错误 | 第51-52页 |
| ·语义错误 | 第52-53页 |
| ·英文单词拼写纠错 | 第53-55页 |
| ·优化翻译与生成词典 | 第55-56页 |
| ·本章小结 | 第56-57页 |
| 第6章 系统描述与实验分析 | 第57-61页 |
| ·网页信息抓取与语料预处理 | 第57-58页 |
| ·翻译提取过程分析 | 第58-59页 |
| ·翻译优化结果分析 | 第59-60页 |
| ·本章小结 | 第60-61页 |
| 结论 | 第61-63页 |
| 参考文献 | 第63-67页 |
| 攻读硕士学位期间发表的学术论文 | 第67-69页 |
| 致谢 | 第69-70页 |
| 详细摘要 | 第70-74页 |