首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文敏感词变形体的识别方法研究与应用

摘要第5-6页
Abstract第6-7页
第1章 绪论第12-16页
    1.1 研究背景及意义第12-13页
    1.2 国内外研究现状第13-14页
    1.3 论文的主要内容第14-15页
    1.4 论文的组织结构第15-16页
第2章 相关技术研究第16-28页
    2.1 相似度计算方法第16-20页
        2.1.1 基于Jaccard系数的相似度计算第16-17页
        2.1.2 基于余弦值的相似度计算第17页
        2.1.3 基于编辑距离的相似度计算第17-19页
        2.1.4 准确性比较第19-20页
    2.2 模式匹配算法第20-25页
        2.2.1 BF算法第20-21页
        2.2.2 KMP算法第21-23页
        2.2.3 BM算法第23-24页
        2.2.4 性能分析第24-25页
    2.3 层次分析法第25-26页
    2.4 评价指标第26-27页
    2.5 本章小结第27-28页
第3章 敏感词变形体识别方法第28-40页
    3.1 敏感词的三种变形模式第28-29页
    3.2 词的拼音模式第29-34页
        3.2.1 音码编码(soundcode SC)第29-31页
        3.2.2 易混拼音分组第31-32页
        3.2.3 基于易混拼音分组的敏感词识别算法第32-34页
    3.3 词的简称模式第34-36页
        3.3.1 词的简称第34-35页
        3.3.2 敏感词的简称识别算法第35-36页
    3.4 词的拆分模式第36-39页
        3.4.1 汉字拆分第36-38页
        3.4.2 基于BM的敏感词拆分识别算法第38-39页
    3.5 本章小结第39-40页
第4章 文本敏感信息过滤第40-46页
    4.1 文本预处理第40页
    4.2 文本敏感程度计算第40-44页
        4.2.1 敏感程度的影响因子第40-43页
        4.2.2 文本敏感程度计算第43-44页
    4.3 文本敏感信息过滤算法第44-45页
    4.4 本章小结第45-46页
第5章 实验与分析第46-52页
    5.1 实验环境第46页
    5.2 数据集第46-47页
    5.3 实验结果与分析第47-50页
        5.3.1 敏感词变形体的识别第47-48页
        5.3.2 文本敏感信息过滤第48-50页
    5.4 本章小结第50-52页
总结与展望第52-53页
    论文完成的主要工作第52页
    未来工作展望第52-53页
参考文献第53-56页
附录: 攻读硕士学位期间的科研情况第56-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:基于物联网技术的分布式杆塔接地电阻检测装置的研究
下一篇:基于智能手机的韩语词汇学习APP设计方案研究