首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于多源数据的话题检测与追踪研究

摘要第5-6页
abstract第6-7页
第一章 绪论第11-17页
    1.1 研究工作的背景与意义第11-12页
    1.2 国内外研究现状第12-15页
        1.2.1 话题检测与追踪相关概念第12页
        1.2.2 国内外研究现状第12-15页
    1.3 论文研究的主要内容第15页
    1.4 论文的结构安排第15-17页
第二章 相关理论和技术第17-31页
    2.1 中文分词第17-18页
    2.2 文本建模第18-20页
    2.3 文本特征选择第20-22页
    2.4 文本挖掘基础第22-27页
        2.4.1 文本分类第22-25页
        2.4.2 文本聚类第25-27页
    2.5 同义词词林及其相似度计算第27-30页
    2.6 本章小结第30-31页
第三章 基于频繁词集聚类的多源数据话题检测第31-45页
    3.1 引言第31-32页
    3.2 话题频繁词集聚类第32-39页
        3.2.1 频繁词集与频繁向量第32-33页
        3.2.2 频繁词集的挖掘第33-34页
        3.2.3 相似度计算第34-36页
        3.2.4 频繁词集聚类第36-39页
            3.2.4.1 基于改进Single-pass的初次聚类第36-38页
            3.2.4.2 初次聚类结果的合并第38-39页
    3.3 基于频繁词集聚类的多源数据话题检测算法第39-44页
        3.3.1 报道和话题的模型选择第39-40页
        3.3.2 报道的特征选择与加权第40页
        3.3.3 相似度计算第40-41页
        3.3.4 多源数据话题检测的实现第41-44页
    3.4 本章小结第44-45页
第四章 基于改进KNN的多源数据自适应话题追踪第45-55页
    4.1 自适应话题追踪难点第45-47页
        4.1.1 传统话题追踪特点分析第45-46页
        4.1.2 自适应话题追踪存在的问题第46-47页
    4.2 话题模型反馈报道的选择策略第47-49页
    4.3 结合词能量模型的话题特征词权重更新策略第49-52页
        4.3.1 传统特征词权重更新第49页
        4.3.2 特征词能量的计算模型第49-52页
            4.3.2.1 词能量模型的理论基础第49-50页
            4.3.2.2 话题特征词能量的计算第50-52页
        4.3.3 结合词能量模型的特征词权重更新策略第52页
    4.4 基于改进KNN的多源数据自适应话题追踪第52-54页
        4.4.1 传统基于KNN的话题追踪特点分析第52页
        4.4.2 基于改进KNN的多源数据的话题追踪第52-54页
    4.5 本章小结第54-55页
第五章 实验结果与分析第55-70页
    5.1 实验设计第55-59页
        5.1.1 实验环境说明第55页
        5.1.2 实验数据集说明第55-57页
        5.1.3 评测标准第57-59页
    5.2 数据预处理第59-60页
    5.3 基于频繁词集聚类的多源数据话题检测第60-65页
        5.3.1 频繁词集的两阶段聚类第60-63页
        5.3.2 多源数据话题检测第63-65页
    5.4 基于改进KNN的多源数据话题追踪第65-69页
        5.4.1 话题特征词选择方法第65-67页
        5.4.2 基于KNN算法的多源数据话题追踪第67-69页
    5.5 本章小结第69-70页
第六章 全文总结与展望第70-72页
    6.1 全文总结第70页
    6.2 下一步工作展望第70-72页
致谢第72-73页
参考文献第73-77页

论文共77页,点击 下载论文
上一篇:面向场景字符识别关键算法的多平台异构加速研究
下一篇:基于AP-SoC的宽带通信信号分析核心软件设计与实现