首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于字边界特征的中文抽词模型研究

摘要第5-6页
Abstract第6页
插图索引第9-10页
附表索引第10-11页
第1章 绪论第11-18页
    1.1 研究背景与意义第11-13页
    1.2 研究现状分析第13-16页
        1.2.1 中文抽词的发展现状第13-14页
        1.2.2 中文抽词的主要问题第14-15页
        1.2.3 中文抽词的主要算法第15-16页
        1.2.4 中文抽词的模型分析第16页
    1.3 本文的研究内容第16-17页
    1.4 论文组织结构第17页
    1.5 本章小结第17-18页
第2章 统计抽词算法第18-23页
    2.1 基于词频的抽词算法第18-20页
        2.1.1 N-gram 模型第18-19页
        2.1.2 字符串共现第19-20页
    2.2 基于互信息的抽词算法第20-21页
    2.3 基于卡方统计量的抽词算法第21-22页
    2.5 本章小结第22-23页
第3章 基本抽词模型第23-34页
    3.1 抽词算法的基本分析第23-24页
    3.2 基本抽词模型第24-31页
        3.2.1 抽词特征第25-26页
        3.2.2 预处理模块第26页
        3.2.3 构词评价模块第26-28页
        3.2.4 选词模块第28-29页
        3.2.5 过滤模块第29页
        3.2.6 基本抽词模型的设计第29-31页
    3.3 对于基本抽词模型的分析第31-33页
    3.4 本章小结第33-34页
第4章 改进型统计抽词模型第34-42页
    4.1 抽词结果的三种标准第34页
    4.2 构词评价模块的改进第34-40页
        4.2.1 构词特征集合第34-36页
        4.2.2 构词评价模块与选词模块的改进第36-37页
        4.2.3 过滤模块的改进第37-39页
        4.2.4 启发式模块的设计第39-40页
    4.3 改进型统计抽词模型第40-41页
    4.4 本章小结第41-42页
第5章 改进后的自动抽词模型的实现第42-58页
    5.1 模型实现的设计分析第42-43页
    5.2 字边界特征第43-44页
    5.3 字分布特征第44-47页
    5.4 相关度特征第47-49页
    5.5 基于阀值的选词策略第49-50页
    5.6 字边界过滤算法第50-51页
    5.7 启发式算法第51-52页
    5.8 构词估计模块第52页
    5.9 实验设计描述第52-54页
    5.10 实验结果及其分析第54-57页
    5.11 本章小结第57-58页
总结与展望第58-60页
参考文献第60-63页
致谢第63-64页
附录 A 攻读学位期间主要成果第64-65页
附录 B 攻读学位期间所参与的项目第65页

论文共65页,点击 下载论文
上一篇:量子克隆算法的优化及其应用研究
下一篇:基于XYZ/SE的C/S体系结构风格研究