首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉语自动标引算法的设计及其在网络舆情监控中的应用

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-13页
    1.1 课题研究背景及意义第9-10页
        1.1.1 研究背景第9-10页
        1.1.2 研究意义第10页
    1.2 本文主要研究工作第10-11页
    1.3 论文组织结构第11-13页
第2章 相关工作综述第13-21页
    2.1 概述第13-14页
    2.2 词法分析第14-15页
    2.3 主题词标引第15-17页
    2.4 近义概念归并第17-19页
    2.5 本章小结第19-21页
第3章 基于改进的最大匹配自动分词算法第21-27页
    3.1 概述第21-22页
    3.2 改进的最大匹配自动分词算法第22-23页
        3.2.1 词典的设计第22页
        3.2.2 改进后的最大匹配分词算法的实现第22-23页
    3.3 未登录词识别与处理第23-26页
        3.3.1 基于词典的共现串最长匹配的改进算法第23-24页
        3.3.2 基于统计学和汉语学规则的未登录词过滤算法第24-26页
        3.3.3 算法描述第26页
    3.4 本章小结第26-27页
第4章 基于融合多方法的主题词标引算法第27-31页
    4.1 概述第27页
    4.2 基于词典的无效词快速过滤第27-28页
    4.3 基于词频和词长的主题词初始权值计算第28-29页
    4.4 基于位置的主题词权值加权第29页
    4.5 基于词跨度的主题词权值加权第29-30页
    4.6 词语总权值的计算方式第30页
    4.7 本章小结第30-31页
第5章 基于Word2Vec的近义概念归并第31-35页
    5.1 概述第31-32页
    5.2 Word2Vec准备工作第32页
    5.3 近义概念的判定第32-33页
    5.4 近义概念的加权与合并第33-34页
    5.5 本章小结第34-35页
第6章 实验分析与性能评测第35-43页
    6.1 实验环境及语料说明第35页
        6.1.1 实验环境第35页
        6.1.2 实验语料第35页
    6.2 自动分词算法评测第35-37页
        6.2.1 基于改进的最大匹配自动分词算法评测第35-36页
        6.2.2 未登录词识别算法评测第36-37页
    6.3 Word2Vec近义概念归并算法评测第37-39页
        6.3.1 Word2Vec训练第37-38页
        6.3.2 近义概念归并效果实验第38-39页
        6.3.3 实验结论第39页
    6.4 汉语自动标引算法评测分析第39-42页
        6.4.1 评测方法第39-40页
        6.4.2 数据准备第40页
        6.4.3 评测结果及分析第40-42页
    6.5 本章小结第42-43页
第7章 自动标引算法在舆情监控中的应用第43-47页
    7.1 概述第43页
    7.2 系统总体设计第43页
    7.3 系统实现第43-46页
    7.4 舆情主题标引结果展示第46页
    7.5 本章小结第46-47页
结论第47-49页
参考文献第49-54页
致谢第54-55页
个人简历第55页

论文共55页,点击 下载论文
上一篇:石墨烯电子输运性质的研究
下一篇:动车组高压布线的电磁兼容性研究