首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web的英柬双语平行句对获取

摘要第5-6页
Abstract第6-7页
第一章 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-12页
        1.2.1 平行语料库构建第11页
        1.2.2 基于Web的双语平行资源获取第11-12页
        1.2.3 双语句对齐技术第12页
    1.3 论文的研究内容第12-14页
    1.4 论文的组织第14-16页
第二章 基于Web的双语平行资源分析第16-20页
    2.1 引言第16-17页
    2.2 平行资源的分析第17-18页
    2.3 基于Web的双语平行句对获取方法第18-19页
    2.4 本章小结第19-20页
第三章 英柬双语平行网页的获取第20-40页
    3.1 引言第20-21页
    3.2 英柬候选网站的获取和过滤第21-22页
    3.3 双语网页获取第22-30页
        3.3.1 网页结构分析第22-26页
        3.3.2 网站模板制定第26-28页
        3.3.3 网络爬虫编写第28-29页
        3.3.4 网页内容存储第29-30页
    3.4 平行网页识别第30-37页
        3.4.1 预处理第31-32页
        3.4.2 候选平行网页对的获取第32-34页
        3.4.3 双语平行网页的识别第34-37页
    3.5 实验结果与分析第37-38页
    3.6 本章小结第38-40页
第四章 英柬双语平行句对获取第40-52页
    4.1 引言第40页
    4.2 句对齐的形式化表示第40-41页
    4.3 句对齐常用方法第41-43页
        4.3.1 基于长度的方法第41-42页
        4.3.2 基于词汇信息的方法第42页
        4.3.3 长度和词汇信息相结合的方法第42-43页
    4.4 句对齐关系第43页
    4.5 基于最大熵模型的英柬句对齐方法第43-50页
        4.5.1 段落对齐第44-46页
        4.5.2 生成候选平行句对第46页
        4.5.3 特征选取第46-50页
    4.6 实验结果及分析第50-51页
    4.7 本章小结第51-52页
第五章 英柬平行句对获取原型系统第52-60页
    5.1 引言第52页
    5.2 实验环境第52页
    5.3 系统整体框架第52-53页
    5.4 系统实现效果第53-58页
    5.5 本章小结第58-60页
第六章 总结和展望第60-62页
    6.1 总结第60-61页
    6.2 下一步工作第61-62页
致谢第62-63页
参考文献第63-68页
附录A 攻读硕士期间发表论文与申请软件著作权第68-69页
附录B 攻读硕士期间参与项目第69-70页
授予学历硕士人员登记表第70页

论文共70页,点击 下载论文
上一篇:基于非线性动力系统的图像处理
下一篇:基于公开密钥算法的移动位置隐私保护的研究