首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于增量聚类的新闻话题发现研究

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-13页
    1.1 课题研究的背景和意义第8-9页
    1.2 国内外研究现状第9-10页
    1.3 现有的话题发现系统存在的问题第10-11页
    1.4 本文的研究内容和组织结构第11-13页
        1.4.1 本文的研究内容第11-12页
        1.4.2 本文的组织结构第12-13页
第二章 论文的相关工作第13-18页
    2.1 文本预处理第13-14页
        2.1.1 中文分词第13-14页
        2.1.2 去停用词第14页
    2.2 文本特征表示与相似度计算第14-15页
        2.2.1 文本特征表示第14-15页
        2.2.2 相似度计算第15页
    2.3 聚类算法第15-16页
        2.3.1 层次聚类算法第15-16页
        2.3.2 划分式聚类算法第16页
        2.3.3 基于密度的方法第16页
        2.3.4 基于网格的方法第16页
    2.4 机器翻译第16-18页
第三章 改进的增量聚类算法的实现第18-35页
    3.1 CRF分词的改进实现第18-21页
        3.1.1 CRF分词存在的问题第18-20页
        3.1.2 实验过程与结果第20-21页
        3.1.3 改进分词的意义第21页
    3.2 传统增量聚类算法的设计第21-25页
        3.2.1 文本向量化第21-23页
        3.2.2 传统增量聚类算法设计第23-24页
        3.2.3 传统增量聚类算法不足第24-25页
    3.3 改进的增量聚类算法设计第25-30页
        3.3.1 改进算法概述第25-26页
        3.3.2 具有更新选择器的增量聚类算法设计与意义第26-27页
        3.3.3 引入待排队列的增量聚类算法设计与意义第27-29页
        3.3.4 ICCQ算法设计第29-30页
    3.4 实验结果与分析第30-35页
        3.4.1 数据来源第30页
        3.4.2 实验过程第30-31页
        3.4.3 评价指标第31页
        3.4.4 实验结果第31-33页
        3.4.5 结果分析第33页
        3.4.6 实验小结第33-35页
第四章 ICCQ结合机器翻译的应用第35-46页
    4.1 ICCQ结合机器翻译应用概述第35-36页
    4.2 统计机器翻译模型第36-39页
    4.3 实验过程与环境搭建第39-41页
        4.3.1 NiuTrans开源翻译系统介绍第39页
        4.3.2 实验的环境搭建第39-40页
        4.3.3 实验的方法与流程第40-41页
    4.4 实验结果第41-44页
    4.5 结果分析第44-46页
第五章 总结与展望第46-48页
    5.1 本文所解决的问题第46页
    5.2 不足之处第46-47页
    5.3 展望第47-48页
参考文献第48-54页
发表文献和科研情况说明第54-55页
致谢第55-56页

论文共56页,点击 下载论文
上一篇:基于UML的形式化框架及其在安全协议验证中的应用
下一篇:基于程序谱的软件错误定位方法研究