首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向互联网新闻的文本聚类算法研究与实现

摘要第5-6页
ABSTRACT第6页
符号对照表第9-10页
缩略语对照表第10-13页
第一章 绪论第13-19页
    1.1 研究背景第13-14页
    1.2 研究目的和意义第14-16页
    1.3 国内外研究现状第16-17页
    1.4 本文主要工作及创新点第17-18页
    1.5 本文结构安排第18-19页
第二章 文本聚类概述第19-27页
    2.1 文本聚类概念第19页
    2.2 文本聚类流程简介第19-20页
    2.3 文本聚类关键技术第20-26页
        2.3.1 文本特征提取第20-21页
        2.3.2 文本表示第21-22页
        2.3.3 文本聚类算法介绍第22-24页
        2.3.4 文本聚类评估方法第24-26页
    2.4 本章小结第26-27页
第三章 互联网新闻文本获取与预处理第27-39页
    3.1 网页采集第27-29页
    3.2 互联网新闻文本预处理第29-37页
        3.2.1 WEB信息抽取第29页
        3.2.2 中文分词第29-30页
        3.2.3 词频统计与TF-IDF文本特征提取第30-32页
        3.2.4 基于向量空间模型的文本表示第32-33页
        3.2.5 文本距离计算第33-34页
        3.2.6 余弦距离稀疏化计算第34-37页
    3.3 本章小结第37-39页
第四章 AHK-P聚类算法设计第39-51页
    4.1 传统H-K方法实现过程与不足第39-41页
    4.2 AHK-P算法设计思路第41-49页
        4.2.1 基于先验知识粗划分文本数据集第42-44页
        4.2.2 优化初始质心提取过程第44-48页
        4.2.3 基于先验知识细划分文本数据集第48-49页
    4.3 AHK-P具体算法设计第49-50页
    4.4 本章小结第50-51页
第五章 新闻文本聚类算法实现与实验验证第51-67页
    5.1 工作平台与实验数据第51-53页
        5.1.1 工作平台第51页
        5.1.2 实验数据第51-53页
    5.2 新闻文本聚类算法实现第53-60页
        5.2.1 文本数据预处理第53-57页
        5.2.2 AHK-P算法实现第57-60页
    5.3 实验评价方法第60-61页
    5.4 实验设计与结果分析第61-65页
        5.4.1 初始质心提取对比实验第61-63页
        5.4.2 AHK-P算法有效性验证实验第63-65页
    5.5 本章小结第65-67页
第六章 总结与展望第67-69页
    6.1 总结第67页
    6.2 展望第67-69页
参考文献第69-73页
致谢第73-75页
作者简介第75-76页

论文共76页,点击 下载论文
上一篇:基于大气散射模型的图像去雾算法研究
下一篇:基于TrustZone的内核完整性保护的研究与实现