首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向特定领域的话题检测系统的设计与实现

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 研究背景和意义第10-11页
    1.2 国内外研究现状第11-13页
    1.3 研究内容第13-14页
    1.4 论文结构与主要工作第14-16页
第二章 关键技术研究第16-30页
    2.1 微博数据采集技术第16-18页
    2.2 文本模型表示第18-19页
        2.2.1 布尔模型第18-19页
        2.2.2 向量空间模型第19页
        2.2.3 主题模型第19页
    2.3 短文本的特征扩展第19-20页
    2.4 特征选择方法第20-22页
    2.5 常用文本聚类算法第22-27页
        2.5.1 常用聚类算法介绍第22-25页
        2.5.2 聚类有效性评价第25-27页
    2.6 关键主题词提取第27-28页
        2.6.1 词语权重度量第27-28页
        2.6.2 频繁项集发现第28页
    2.7 本章小结第28-30页
第三章 基于doc2vec的微博话题检测模型第30-48页
    3.1 微博用户和数据特征分析第30-31页
        3.1.1 微博用户特征分析第30-31页
        3.1.2 微博文本特征分析第31页
    3.2 基于重复串的特征提取第31-33页
    3.3 基于词向量的文本向量化第33-39页
        3.3.1 LDA模型生成主题词向量第34-36页
        3.3.2 word2vec工具生成词向量第36-38页
        3.3.3 doc2vec工具生成句子向量第38-39页
    3.4 微博话题检测第39页
    3.5 实验设计与结果分析第39-46页
        3.5.1 实验数据第39-40页
        3.5.2 实验数据处理第40-41页
        3.5.3 实验环境第41页
        3.5.4 评估指标第41页
        3.5.5 对比实验设计第41-46页
    3.6 本章小结第46-48页
第四章 系统设计与实现第48-64页
    4.1 系统需求分析第48-50页
    4.2 系统架构设计第50-52页
    4.3 系统数据库设计第52-53页
    4.4 关键模块实现第53-62页
        4.4.1 数据采集模块第54-55页
        4.4.2 文本预处理模块第55-57页
        4.4.3 话题检测模块第57-59页
        4.4.4 报告结果展示模块第59-62页
    4.5 本章小结第62-64页
第五章 总结与展望第64-66页
参考文献第66-70页
致谢第70-72页
攻读学位期间发表的学术论文目录第72页

论文共72页,点击 下载论文
上一篇:基于去中心化的物联网安全的研究与应用
下一篇:基于穿戴式设备的运动检测算法研究及应用