首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web的汉越可比较语料库构建方法研究

授予学历硕士人员登记表第2-5页
摘要第5-7页
Abstract第7-8页
第一章 绪论第12-18页
    1.1. 研究背景及意义第12页
    1.2. 国内外研究现状第12-14页
    1.3. 本文的主要研究内容第14-15页
    1.4. 本文的组织结构第15-18页
第二章 可比较语料库挖掘系统的设计与框架第18-24页
    2.1. 相关研究第18-20页
        2.1.1. 基于特征匹配第18-19页
        2.1.2. 基于跨语言信息检索第19-20页
        2.1.3. 基于维基百科链接第20页
    2.2. 可比较语料挖掘系统设计与框架第20-23页
    2.3. 本章小结第23-24页
第三章 基于文本密度块的WEB新闻抽取方法第24-34页
    3.1. 引言第24-25页
    3.2. 相关研究第25-28页
        3.2.1. 基于统计的方法第25页
        3.2.2 基于DOM的方法第25-26页
        3.2.3 基于网页分块的方法第26-27页
        3.2.4 基于标签窗的方法第27-28页
    3.3. 新闻网页抽取方案设计第28页
    3.4. 基于文本密度块的WEB新闻抽取方法第28-31页
        3.4.1. 数据预处理第28-30页
        3.4.2. 新闻信息抽取第30-31页
    3.5. 实验与分析第31-32页
        3.5.1. 语料第31-32页
        3.5.2. 评价指标第32页
        3.5.3. 实验设计与结果分析第32页
    3.6. 本章小结第32-34页
第四章 基于TextRank算法提取新闻关键事件主题句第34-42页
    4.1. 引言第34页
    4.2. 事件抽取的研究方法第34-36页
        4.2.1. 基于机器学习的事件抽取第35页
        4.2.2. 基于模板匹配的规则方法第35-36页
    4.3. 关键事件主题句提取第36-39页
        4.3.1. 基本流程第36-37页
        4.3.2. 事件识别第37-38页
        4.3.3. TextRank权值计算第38-39页
    4.4. 实验与分析第39-40页
        4.4.1. 实验数据第39页
        4.4.2. 评价标准第39页
        4.4.3. 实验结果与分析第39-40页
    4.5. 本章小结第40-42页
第五章 基于向量空间的跨语言新闻文本相似度计算第42-52页
    5.1. 引言第42页
    5.2. 相关工作介绍第42-43页
    5.3. 跨语言文本匹配第43-46页
        5.3.1. 基本流程第43-44页
        5.3.2. 双语向量空间的构建第44-45页
        5.3.3. 时间相似度计算第45-46页
        5.3.4. 相似度计算第46页
    5.4. 实验与分析第46-50页
        5.4.1. 测试样本第46-48页
        5.4.2. 评价标准第48-49页
        5.4.3. 实验结果与分析第49-50页
    5.5. 本章小结第50-52页
第六章 总结及展望第52-54页
    6.1. 总结第52-53页
    6.2. 展望第53-54页
致谢第54-56页
参考文献第56-64页
附录A 攻读硕士期间发表论文与申请软件著作权第64-65页
附录B 攻读硕士期间参与项目第65页

论文共65页,点击 下载论文
上一篇:基于Anaconda-CL卡的人脸识别系统构建研究与实现
下一篇:自适应范数约束图像正则化重建研究