首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉柬双语可比语料库构建方法研究

摘要第5-7页
Abstract第7-8页
第一章 绪论第11-17页
    1.1 研究背景及意义第11页
    1.2 国内外研究现状第11-14页
    1.3 本文的主要研究内容第14-15页
    1.4 本文的组织结构第15-17页
第二章 基于LM算法的新闻文档关键词提取方法第17-27页
    2.1 引言第17-18页
    2.2 LM算法简介第18-19页
    2.3 新闻文档关键词识别方法第19-23页
        2.3.1 预处理第19-20页
        2.3.2 词汇特征表达式第20-21页
        2.3.3 BP神经网络的实现第21-23页
    2.4 实验设计和结果分析第23-25页
        2.4.1 实验语料第23页
        2.4.2 评价标准第23-24页
        2.4.3 实验及结果分析第24-25页
    2.5 本章小结第25-27页
第三章 基于词典的柬-汉双语LDA模型的构建方法第27-35页
    3.1 引言第27-28页
    3.2 柬汉双语LDA模型第28-32页
        3.2.1 柬汉词典的引入第28-29页
        3.2.2 KCB-LDA模型的构建第29-30页
        3.2.3 推导第30-31页
        3.2.4 新样本主题的推断第31-32页
    3.3 实验设计与结果分析第32-34页
        3.3.1 实验语料第32页
        3.3.2 实验设计与结果分析第32-34页
    3.4 本章小结第34-35页
第四章 基于改进层次聚类的可比语料获取方法研究第35-45页
    4.1 引言第35-36页
    4.2 融合主题和要素的双语文本相似度第36-39页
        4.2.1 双语文档的要素提取第36-37页
        4.2.2 融合主题和要素的文本相似性度量第37-39页
    4.3 基于改进型层次算法的文本聚类第39-41页
        4.3.1 层次型聚类常用算法第39-40页
        4.3.2 改进的层次聚类第40-41页
    4.4 实验与结果分析第41-44页
        4.4.1 实验语料第41-42页
        4.4.2 可比语料评价标准第42-43页
        4.4.3 实验结果与分析第43-44页
    4.5 本章小结第44-45页
第五章 总结和展望第45-47页
    5.1 总结第45-46页
    5.2 工作展望第46-47页
致谢第47-49页
参考文献第49-55页
附录A 攻读硕士期间发表论文第55-57页
附录B 攻读硕士期间参与项目第57-59页
附录C 攻读硕士期间申请软件的著作权第59页

论文共59页,点击 下载论文
上一篇:高职院校资产管理系统的研究及实现
下一篇:基于约束条件随机场的柬埔寨语命名实体识别研究