首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

社交网络短文本聚类研究与实现

摘要第4-5页
abstract第5-6页
第1章 绪论第9-18页
    1.1 课题来源第9页
    1.2 课题研究背景、目的及意义第9-11页
    1.3 相关领域的国内外研究现状第11-16页
    1.4 本文的主要研究内容及组织结构第16-18页
        1.4.1 本文的主要研究内容第16-17页
        1.4.2 本文组织结构第17-18页
第2章 社交网络新词发现方法研究第18-30页
    2.1 新词发现概述第18-21页
        2.1.1 相关理论第18-19页
        2.1.2 新词发现基本流程第19-21页
    2.2 文本预处理第21-23页
        2.2.1 中文分词第21-22页
        2.2.2 特殊字符及停用词过滤第22-23页
    2.3 候选词串抽取第23-27页
        2.3.1 组合词串的筛选第23-25页
        2.3.2 构造广义后缀树第25-27页
        2.3.3 频繁词串的抽取第27页
    2.4 新词发现第27-29页
        2.4.1 统计特征的选择第28-29页
        2.4.2 综合特征判定方法第29页
    2.5 本章小结第29-30页
第3章 短文本聚类方法研究第30-43页
    3.1 文本再分词第31页
    3.2 短文本的表示第31-36页
        3.2.1 短文本表示模型的选择第31-33页
        3.2.2 特征项提取第33-34页
        3.2.3 特征权重的计算第34-35页
        3.2.4 短文本相似度计算第35-36页
    3.3 短文本的聚类方法研究第36-42页
        3.3.1 文本聚类相关理论第36-37页
        3.3.2 词共现分析第37-40页
        3.3.3 基于词共现的K-means聚类第40-42页
    3.4 本章小结第42-43页
第4章 聚类系统的实现及性能测试第43-57页
    4.1 聚类效果评价指标第43-44页
    4.2 系统数据来源及开发环境第44-45页
        4.2.1 实验数据来源第44-45页
        4.2.2 系统开发环境第45页
    4.3 系统模块的实现第45-52页
        4.3.1 数据预处理模块第45-47页
        4.3.2 新词发现模块第47-49页
        4.3.3 短文本表示模块第49-50页
        4.3.4 短文本聚类模块第50-52页
    4.4 系统测试结果对比及分析第52-56页
        4.4.1 新词发现结果的对比与分析第52-53页
        4.4.2 短文本聚类结果对比与分析第53-56页
    4.5 本章小结第56-57页
第5章 总结与展望第57-59页
    5.1 全文研究工作总结第57-58页
    5.2 下一步工作展望第58-59页
致谢第59-60页
参考文献第60-63页

论文共63页,点击 下载论文
上一篇:粘连防伪码识别研究及其手持式系统实现
下一篇:基于稀疏背景建模的视频动目标检测方法研究