首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文分词算法的研究与实现

摘要第4-6页
Abstract第6-7页
第1章 绪论第11-17页
    1.1 中文分词的背景及意义第11-12页
    1.2 中文分词的难点第12-15页
        1.2.1 中文中词长带来的分词问题第12页
        1.2.2 中文的切分歧义问题第12-15页
        1.2.3 中文分词的未登录词问题第15页
    1.3 中文分词的研究现状第15-16页
    1.4 本文的结构第16-17页
第2章 基于词典的分词算法研究第17-27页
    2.1 正向最大匹配算法第17-19页
        2.1.1 最大匹配算法的理论基础第17-18页
        2.1.2 基于词典的正向最大匹配算法的流程第18-19页
    2.2 基于词典的逆向最大匹配算法第19-21页
    2.3 基于词典的双向匹配算法第21-23页
    2.4 N-最短路径分词法第23-27页
第3章 中文分词的词典结构分析第27-38页
    3.1 基于整词二分法的词典第28-30页
    3.2 基于Trie索引树的词典第30-32页
    3.3 改进的词典结构第32-38页
        3.3.1 基于整词二分法的词典的初步改进第33-34页
        3.3.2 双字哈希词典第34-38页
第4章 基于统计的分词方法研究第38-43页
    4.1 互现信息模型第39-40页
    4.2 N元语言模型第40-43页
第5章 机械分词与统计分词结合算法的实现第43-69页
    5.1 编码问题第45-46页
    5.2 中文句子的预处理第46-47页
    5.3 使用双向匹配算法进行歧义判断第47-52页
        5.3.1 基于双向匹配算法进行歧义识别的合理性第47-48页
        5.3.2 机械分词及相应词典的改进第48-52页
    5.4 Bin-Gram语言模型第52-58页
        5.4.1 模型的创建过程第52-54页
        5.4.2 求解 3-Best分词结果第54-58页
    5.5 使用隐马尔可夫模型进行结果评估第58-63页
        5.5.1 隐马尔可夫模型(HMM)第58-61页
        5.5.2 HMM用于中文分词评估第61-63页
    5.6 中文人名识别模块第63-69页
        5.6.1 中文人名的特点第63-64页
        5.6.2 常见的人名识别方法第64-65页
        5.6.3 规则与统计相结合的人名识别方法第65-69页
第6章 实验结果与分析第69-77页
    6.1 实验的环境介绍第69-70页
    6.2 词典加载速度实验第70-71页
    6.3 分词速度实验第71-73页
        6.3.1 不同词典的分词速度对比第71-72页
        6.3.2 不同分词方法分词速度对比第72-73页
    6.4 分词效果实验第73-75页
    6.5 人名识别实验第75-77页
第7章 总结与展望第77-78页
参考文献第78-81页
致谢第81页

论文共81页,点击 下载论文
上一篇:我国上市家族企业不同生命周期阶段激励约束机制研究--以A股房地产行业为例
下一篇:“互联网+”背景下黄山风景区旅游信息服务平台调查分析