首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于指纹检索的文本相似性检测技术研究与应用

摘要第4-5页
Abstract第5-6页
1 绪论第9-14页
    1.1 课题的研究背景和意义第9-10页
    1.2 国内外的研究现状第10-11页
    1.3 研究内容第11-12页
    1.4 论文的组织结构第12-14页
2 文档相似性度量技术分析第14-23页
    2.1 文档距离计算方法第14-16页
        2.1.1 文档距离的度量第14-15页
        2.1.2 度量方法分析第15-16页
    2.2 minwise哈希估计算法第16-18页
    2.3 b位minwise哈希估计算法第18-21页
    2.4 本章小结第21-23页
3 基于指纹分组的并行检索算法第23-34页
    3.1 文档指纹的距离检索第23-25页
        3.1.1 特征指纹的提取第23-24页
        3.1.2 海明距离检索问题第24-25页
    3.2 指纹分组检索算法第25-26页
    3.3 指纹分组的并行检索第26-31页
        3.3.1 指纹分组并行检索第26-28页
        3.3.2 时间复杂度分析第28-29页
        3.3.3 并行模型第29-31页
    3.4 实验及结果分析第31-33页
    3.5 本章小结第33-34页
4 文本细粒度提取技术的研究第34-43页
    4.1 文本细粒度的划分第34-37页
    4.2 提取文档特征集合第37-41页
        4.2.1 分词第37-40页
        4.2.2 去停用词第40页
        4.2.3 提取shingle特征第40-41页
    4.3 生成指纹第41-42页
    4.4 本章小结第42-43页
5 文本相似性检测系统应用研究第43-53页
    5.1 系统框架第43-46页
        5.1.1 功能框架第43-44页
        5.1.2 处理流程第44-45页
        5.1.3 硬件框架第45-46页
    5.2 文档聚类第46-48页
    5.3 相似度估计第48-50页
    5.4 相似文档的详细比对第50-51页
    5.5 系统实现第51-52页
    5.6 本章小结第52-53页
6 总结与展望第53-55页
    6.1 工作总结第53-54页
    6.2 进一步的研究第54-55页
参考文献第55-60页
攻读学位期间主要的研究成果第60-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:浮选泡沫图像纹理特征提取研究及应用
下一篇:基于手机加速度传感器的身份认证关键技术研究