首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

数学学术文献自然语言处理中的若干问题

摘要第4-5页
abstract第5页
第一章 绪论第9-15页
    §1.1 问题的提出第9-11页
    §1.2 前期工作第11-15页
        §1.2.1 锚点对齐第11页
        §1.2.2 Jieba分词技术第11-12页
        §1.2.3 语料库的创立第12-13页
        §1.2.4 句对齐第13-14页
        §1.2.5 中英分词第14-15页
第二章 相关理论及技术研究第15-23页
    §2.1 命名实体识别第15-17页
        §2.1.1 命名实体识别背景第15-16页
        §2.1.2 命名实体识别方法第16页
        §2.1.3 HMM模型第16-17页
    §2.2 最大熵模型第17-19页
    §2.3 条件随机场第19-20页
        §2.3.1 条件随机场介绍第19页
        §2.3.2 条件随机场(CRF)模型的讲解第19-20页
    §2.4 ICTCLAS分词技术第20-21页
    §2.5 中文分词的主要困难第21-23页
第三章 系统设计第23-37页
    §3.1 总体框架设计第23-25页
    §3.2 建立语料库第25-32页
        §3.2.1 语料库总体设计第26-28页
        §3.2.2 具体实施重点模块第28-30页
        §3.2.3 公式算法第30-31页
        §3.2.4 断句第31-32页
    §3.3 构造词典第32-34页
        §3.3.1 语料的标注第32-33页
        §3.3.2 特征模板第33页
        §3.3.3 结果评价第33页
        §3.3.4 实验结果分析第33-34页
    §3.4 词典更新第34-36页
        §3.4.1 英文分词部分第34-35页
        §3.4.2 中文分词部分第35-36页
    §3.5 ICTCLAS分词和Jieba分词的区别第36-37页
第四章 系统的实现第37-43页
    §4.1 系统环境第37-38页
        §4.1.1 Python语言第37-38页
        §4.1.2 开发的IDE环境第38页
    §4.2 重点和操作实现第38-40页
        §4.2.1 总体设计第38页
        §4.2.2 公式准确率第38-40页
    §4.3 结果展示第40-43页
参考文献第43-46页
致谢第46页

论文共46页,点击 下载论文
上一篇:面向美食的垂直搜索引擎的设计与实现
下一篇:光学图像加密及水印技术的研究