首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉越双语新闻话题发现研究

摘要第5-7页
Abstract第7-8页
第一章 绪论第12-18页
    1.1 研究背景及意义第12-13页
    1.2 新闻话题的国内外研究现状第13-16页
    1.3 研究内容与组织结构第16-18页
        1.3.1 研究内容第16-17页
        1.3.2 论文组织第17-18页
第二章 新闻话题发现基础理论第18-30页
    2.1 新闻话题发现的任务第18-20页
        2.1.1 单语言来源的话题检测任务第18页
        2.1.2 跨语言多语言的话题检测任务第18-19页
        2.1.3 话题发现体系结构第19-20页
    2.2 新闻话题发现的相关理论第20-28页
        2.2.1 新闻话题发现与检测的语料库第20-21页
        2.2.2 语料库内容第21-22页
        2.2.3 基于Hadoop的汉越双语新闻语料爬取第22-25页
        2.2.4 文本表示模型第25-27页
        2.2.5 TF-IDF第27页
        2.2.6 相似度计算方法第27-28页
    2.3 本章小结第28-30页
第三章 融合要素关联关系的中文新闻话题聚类第30-38页
    3.1 引言第30页
    3.2 关于近邻传播聚类算法第30-31页
    3.3 融合要素关联关系的中文新闻话题聚类模型构建第31-35页
        3.3.1 新闻页面初始相似度矩阵构造第32页
        3.3.2 利用要素关联关系校正初始相似度矩阵第32-33页
        3.3.3 要素关联特征约束及相似度校正第33-34页
        3.3.4 新闻话题聚类模型构建第34-35页
    3.4 实验结果与分析第35-37页
        3.4.1 实验数据第35页
        3.4.2 评价方法第35-36页
        3.4.3 实验结果与分析第36-37页
    3.5 本章小结第37-38页
第四章 基于可比语料词语相似度的汉越跨语言话题发现第38-46页
    4.1 引言第38-39页
    4.2 基于可比语料词语相似度的汉越跨语言话题发现方法第39-43页
        4.2.1 基于可比语料的汉越词语相关性第40-41页
        4.2.2 基于汉越词语相似度的跨语言查询翻译模型构建第41-42页
        4.2.3 越南语文档聚类及话题分析第42-43页
    4.3 实验结果与分析第43-44页
        4.3.1 实验数据第43页
        4.3.2 实验评测指标与结果分析第43-44页
    4.4 本章小结第44-46页
第五章 汉语-越南语舆情话题发现原型系统第46-52页
    5.1 引言第46页
    5.2 汉越双语话题发现系统整体架构第46-47页
    5.3 数据集第47-48页
    5.4 系统功能第48-51页
    5.5 本章小结第51-52页
第六章 结束语第52-54页
    6.1 论文总结第52页
    6.2 下一步工作第52-54页
致谢第54-56页
参考文献第56-64页
附录A 攻读硕士期间发表论文与申请软件著作权第64-66页
附录B 攻读硕士期间参与项目第66-68页
附录C 汉越双语新闻话题聚类结果第68-70页

论文共70页,点击 下载论文
上一篇:回族高中生的民族认同与自我概念状况及其关系研究--以开远第四中学为例
下一篇:木荷人工林常用数表以及经济成熟的研究