首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于字频分布的中文网页编码识别研究

致谢第7-8页
摘要第8-9页
ABSTRACT第9-10页
第一章 绪论第15-18页
    1.1 概述第15-16页
        1.1.1 研究背景与意义第15页
        1.1.2 中文编码识别研究现状第15-16页
    1.2 本文研究内容第16-17页
    1.3 论文的组织结构第17-18页
第二章 编码识别技术第18-29页
    2.1 中文编码字符集第18-19页
        2.1.1 中文编码第18-19页
        2.1.2 编码范围第19页
    2.2 中文编码识别算法第19-28页
        2.2.1 编码识别算法的分类第19-20页
        2.2.2 基于字符集范围的识别算法第20页
        2.2.3 汉字编码统计算法第20页
        2.2.4 基于码制可信度的识别算法第20-21页
        2.2.5 贝叶斯分类编码识别算法第21-23页
        2.2.6 Unigram编码识别算法第23-25页
        2.2.7 CodeFinder算法第25-28页
    2.3 本章小结第28-29页
第三章 模式匹配算法第29-40页
    3.1 模式匹配算法概述第29-30页
    3.2 单模式匹配算法第30-34页
        3.2.1 BM算法第30-31页
        3.2.2 BMH算法第31-32页
        3.2.3 QS算法第32-34页
    3.3 多模式匹配算法第34-39页
        3.3.1 AC算法第34-37页
        3.3.2 AC BM算法第37-39页
    3.4 本章小结第39-40页
第四章 适合中文网页的编码识别算法第40-54页
    4.1 网页环境第40-41页
    4.2 现存算法的不足第41-42页
        4.2.1 汉字编码统计算法的不足第41页
        4.2.2 贝叶斯分类编码识别算法的不足第41页
        4.2.3 Unigram编码识别算法的不足第41页
        4.2.4 CoderFinder算法的不足第41-42页
    4.3 FKI算法第42-51页
        4.3.1 高频字符表第43-44页
        4.3.2 编码匹配第44-46页
        4.3.3 状态/码制表第46-47页
        4.3.4 FKI算法描述第47-48页
        4.3.5 FKI算法识别举例第48-51页
    4.4 FKI算法分析第51-53页
        4.4.1 准确率第51-52页
        4.4.2 时间性能第52页
        4.4.3 可扩展性第52-53页
    4.5 本章小结第53-54页
第五章 FKI算法性能测试第54-60页
    5.1 实验环境第54页
    5.2 实验方案第54页
    5.3 实验数据及分析第54-59页
    5.4 本章小结第59-60页
第六章 展望与总结第60-61页
    6.1 总结第60页
    6.2 展望第60-61页
参考文献第61-64页
攻读硕士学位期间的学术活动及成果情况第64-65页

论文共65页,点击 下载论文
上一篇:基于Flex的企业创新方法服务平台的设计与研究
下一篇:监控视频的摘要提取方法研究