首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

HMM在中文评价挖掘中的研究与应用

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第12-20页
    1.1 研究的背景及意义第12-13页
    1.2 国内外研究现状及分析第13-16页
        1.2.1 隐马尔可夫模型研究进展第13-14页
        1.2.2 评价挖掘研究进展第14-16页
    1.3 电商商品评价的一些特点第16-18页
    1.4 论文的主要工作第18页
    1.5 论文的结构第18-20页
第二章 评价挖掘的典型模型第20-39页
    2.1 引言第20页
    2.2 基于点互信息计算模型第20-21页
    2.3 最大熵马尔可夫模型第21-23页
        2.3.1 熵的定义第21-22页
        2.3.2 最大熵原理第22页
        2.3.3 最大熵马尔科夫模型第22-23页
    2.4 隐马尔可夫模型第23-32页
        2.4.1 全概率公式和贝叶斯公式第24-25页
        2.4.2 贝叶斯方法与中文分词第25-26页
        2.4.3 马尔科夫模型第26-27页
        2.4.4 隐马尔可夫模型第27-32页
    2.5 条件随机场模型第32-38页
        2.5.1 条件随机场的定义第32-33页
        2.5.2 条件随机场的参数化形式第33-34页
        2.5.3 条件随机场的简化形式第34-35页
        2.5.4 条件随机场的矩阵形式第35页
        2.5.5 条件随机场的三个基本问题及求解第35-38页
    2.6 四种模型的比较第38页
    2.7 本章小结第38-39页
第三章 基于词性词汇的隐马尔可夫模型第39-52页
    3.1 引言第39页
    3.2 与词性词汇相关的隐马尔科夫模型第39-42页
        3.2.1 基于点互信息模型的局限性第39-40页
        3.2.2 隐马尔可夫模型与条件随机场模型的局限性第40页
        3.2.3 与词性词汇相关的隐马尔科夫模型第40-42页
    3.3 模型的训练与计算第42-51页
        3.3.1 参数训练问题第42-44页
        3.3.2 零概率问题第44-47页
        3.3.3 未登录词过多的问题第47-48页
        3.3.4 浮点数下溢问题第48页
        3.3.5 模型的计算第48-50页
        3.3.6 同义词近义词问题第50-51页
    3.4 本章小结第51-52页
第四章 模型训练与效果优化第52-72页
    4.1 引言第52-53页
    4.2 原始语料准备与预处理第53-60页
        4.2.1 目标数据概况第53-54页
        4.2.2 目标数据的获取第54-57页
        4.2.3 最小切割法分词第57-58页
        4.2.4 减少未登录词数量第58-60页
    4.3 训练数据的人工标注第60-64页
        4.3.1 训练数据的人工标注规则第60-61页
        4.3.2 人工标注TAG的组成第61-62页
        4.3.3 人工标注TAG的标准第62-63页
        4.3.4 训练数据的人工标注第63-64页
    4.4 训练数据产出第64-66页
    4.5 模型训练的自学习过程第66页
    4.6 中文评价挖掘第66-70页
        4.6.1 评价的情感极性判定第67-68页
        4.6.2 评价对象提取第68-69页
        4.6.3 同义词与近义词的合并第69-70页
    4.7 本章小结第70-72页
第五章 实验与分析第72-78页
    5.1 引言第72页
    5.2 模型评价指标介绍第72-73页
    5.3 模型评价实验过程与评测第73-77页
    5.4 本章小结第77-78页
第六章 工作总结与展望第78-80页
    6.1 工作总结第78-79页
    6.2 工作展望第79-80页
致谢第80-81页
参考文献第81-85页
攻读硕士期间的成果第85页

论文共85页,点击 下载论文
上一篇:基于MapReduce的文本聚类算法并行化研究与实现
下一篇:多曝光HDR图像生成方法研究