首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于多特征指纹的舆情数据重复识别方法

摘要第6-7页
Abstract第7页
第一章 绪论第10-14页
    1.1 研究背景及意义第10-11页
    1.2 本文主要工作第11-12页
    1.3 本文组织结构第12-14页
第二章 海量舆情数据重复识别问题概述第14-25页
    2.1 引言第14页
    2.2 研究现状与相关工作第14-22页
        2.2.1 精确重复识别第14-16页
        2.2.2 近似重复识别第16-18页
        2.2.3 海量数据近似重复识别第18-22页
    2.3 文本重复识别的定义第22-23页
    2.4 海量文本重复识别解决框架第23-24页
    2.5 本章小结第24-25页
第三章 文本特征指纹提取第25-32页
    3.1 引言第25页
    3.2 数据预处理第25-26页
    3.3 哈希函数选择第26-28页
    3.4 特征指纹提取第28-31页
    3.5 本章小结第31-32页
第四章 基于特征指纹组的文本重复识别算法第32-45页
    4.1 引言第32页
    4.2 基于无加权投票的文本重复识别算法第32-35页
    4.3 基于正确率加权的文本重复识别算法第35-37页
    4.4 基于BOOSTING的文本重复识别算法第37-40页
    4.5 实验设计与实验结果第40-43页
        4.5.1 实验数据和实验环境介绍第40-41页
        4.5.2 实验评价标准第41页
        4.5.3 实验实施与结果分析第41-43页
    4.6 本章小结第43-45页
第五章 海量舆情数据特征指纹组比对方法第45-58页
    5.1 引言第45页
    5.2 基于索引的特征指纹组比对方法第45-50页
    5.3 基于分段索引的特征指纹组比对方法第50-54页
    5.4 实验设计与实验结果第54-56页
        5.4.1 实验数据和实验环境介绍第54页
        5.4.2 实验评价标准第54页
        5.4.3 实验实施与结果分析第54-56页
    5.5 本章小结第56-58页
第六章 总结与展望第58-60页
    6.1 本文工作总结第58-59页
    6.2 不足与展望第59-60页
参考文献第60-63页
致谢第63-64页
附录第64-65页

论文共65页,点击 下载论文
上一篇:基于数据仓库的券商业务分析门户的设计与实现
下一篇:基于backbone框架的阅读器的设计与实现