基于WEB挖掘的双语对获取技术研究

中文摘要	第1-4页
ABSTRACT	第4-7页
第一章绪论	第7-12页
·研究背景与意义	第7-8页
·国内外研究现状	第8-11页
·本文研究内容	第11页
·论文的结构	第11-12页
第二章短语对齐概述	第12-17页
·双语对齐概述	第12页
·句子对齐	第12-14页
·短语对齐	第14-16页
·本章小结	第16-17页
第三章基于搜索引擎的汉英短语对齐	第17-33页
·初始对齐	第17-22页
·汉语分词	第17-18页
·中文A3 区全角字符转换	第18页
·英文分词	第18-19页
·GIZA++训练	第19-22页
·词性标注	第22-23页
·规则选词	第23-26页
·单字组合词规则	第24页
·多字组合词规则	第24-26页
·短语切分方法	第26-28页
·基于Google网络搜索频率数的短语对齐	第28-30页
·Google API 介绍	第29-30页
·基于Google搜索引擎的短语对齐算法	第30页
·实验结果与分析	第30-32页
·本章小结	第32-33页
第四章双语对的获取研究	第33-47页
·背景介绍	第33页
·算法思想	第33-34页
·所使用的词典	第34页
·伪代码	第34-36页
·双语对获取流程图	第36-37页
·双语对获取过程的主要步骤	第37-38页
·双语对获取过程的详细说明	第38-44页
·实验结果和分析	第44-46页
·本章小结	第46-47页
第五章总结与展望	第47-48页
参考文献	第48-51页
发表论文和科研情况说明	第51-52页
致谢	第52页