首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中泰跨语言话题检测方法与技术研究

摘要第3-4页
Abstract第4页
第一章 绪论第8-15页
    1.1 研究背景第8-9页
        1.1.1 话题检测技术的缘起第8页
        1.1.2 跨语言话题检测技术第8-9页
    1.2 研究现状第9-12页
        1.2.1 单语言话题检测研究现状第9-11页
        1.2.2 跨语言话题检测研究现状第11-12页
    1.3 本文主要创新工作第12-14页
    1.4 本文结构第14-15页
第二章 相关研究及理论介绍第15-26页
    2.1 单语言文本相似度算法第15-18页
        2.1.1 文本相似度的定义第15页
        2.1.2 常见文本相似度算法第15-18页
    2.2 跨语言文本相似度算法第18-19页
    2.3 WordNet简介第19-20页
    2.4 主题模型第20-24页
        2.4.1 PLSA模型第20-21页
        2.4.2 LDA模型第21-24页
    2.5 话题检测中的几个基本概念第24-26页
        2.5.1 事件第24页
        2.5.2 话题第24页
        2.5.3 新闻报道第24页
        2.5.4 新闻报道-话题-事件的关系第24-26页
第三章 中泰文跨语言文本相似度计算方法研究第26-37页
    3.1 引言第26页
    3.2 文本预处理第26-28页
    3.3 文本特征选择第28-29页
    3.4 中泰语言空间的转换第29-30页
    3.5 语义消歧第30-32页
    3.6 中泰文本相似度计算第32-37页
        3.6.1 基于信息内容相似度算法第32-34页
        3.6.2 改进IC模型第34页
        3.6.3 算法设计第34-37页
第四章 中泰跨语言话题检测方法研究第37-53页
    4.1 跨语言话题检测任务第37-38页
    4.2 中泰文跨语言话题检测总体结构第38-39页
    4.3 中泰新闻文本的爬取第39-40页
    4.4 中泰文相似文本对构建第40-42页
    4.5 中泰跨语言联合LDA模型的构建第42-43页
    4.6 LDA模型Gibbs Sampling求解法第43-45页
    4.7 基于互信息的中泰话题对齐算法第45-48页
        4.7.1 互信息的定义第45页
        4.7.2 中泰话题对齐第45-48页
    4.8 中泰跨语言话题检测任务实现第48-53页
        4.8.1 跨语言话题聚类第50-51页
        4.8.2 跨语言新话题检测第51-53页
第五章 实验结果及分析第53-61页
    5.1 中泰文跨语言文本相似度计算实验及分析第53-55页
        5.1.1 语义消歧实验第53-54页
        5.1.2 中泰文跨语言文本相似度计算实验第54-55页
    5.2 中泰跨语言话题检测实验设计及分析第55-60页
        5.2.1 封闭新闻文本集实验第56-58页
        5.2.2 开放新闻文本集实验第58-59页
        5.2.3 中泰跨语言新话题检测实验第59-60页
    5.3 小结第60-61页
第六章 结论第61-63页
致谢第63-64页
参考文献第64-68页
攻读硕士学位期间的学术成果第68-70页

论文共70页,点击 下载论文
上一篇:运动目标检测的背景模型建立和晃动目标抑制
下一篇:光照不均匀车牌图像直方图均衡化增强算法研究