首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向网络舆情的哈萨克文热点词提取方法研究

摘要第2-4页
ABSTRACT第4-5页
第一章 绪论第8-12页
    1.1 研究背景及意义第8-9页
    1.2 研究现状第9-10页
    1.3 论文组织结构第10-12页
第二章 相关技术理论与方法第12-20页
    2.1 网络舆情研究概述第12-14页
    2.2 热点词提取对网络舆情的重要作用第14-15页
    2.3 常见词汇权值计算方法第15-18页
        2.3.1 基于词频的权重计算方法第15页
        2.3.2 基于词频位置加权的权重计算方法第15-16页
        2.3.3 基于TF-IDF算法的权重计算方法第16-17页
        2.3.4 基于TF-PDF算法的词汇权重计算方法第17-18页
    2.4 本文选取的词汇权值计算方法第18页
    2.5 词词组合第18-19页
    2.6 评价标准第19页
    2.7 本章小结第19-20页
第三章 哈萨克文热点词提取算法研究第20-32页
    3.1 算法总体流程第20-21页
    3.2 数据采集及其预处理第21-24页
        3.2.1 数据来源第21页
        3.2.2 网页爬取及正文抽取第21-24页
    3.3 文本预处理第24-27页
        3.3.1 哈语取词第24-25页
        3.3.2 停用词过滤第25-26页
        3.3.3 词干提取第26-27页
    3.4 信息熵结合 3σ准则来过滤“无关词”第27-28页
        3.4.1 计算词汇信息熵第27页
        3.4.2 3σ准则第27-28页
    3.5 词汇热度计算第28-30页
        3.5.1 媒体关注度思想第28-29页
        3.5.2 位置加权第29-30页
        3.5.3 本文改进后的词汇热度计算方法第30页
    3.6 热点词组合第30-31页
    3.7 本章小结第31-32页
第四章 实验结果与分析第32-43页
    4.1 实验语料第32页
    4.2 测试环境及系统框架结构第32-34页
        4.2.1 测试环境第32页
        4.2.2 系统框架第32-34页
    4.3 实验结果与分析第34-42页
        4.3.1 第一组实验第34-38页
        4.3.2 第二组实验第38-42页
    4.4 本章小结第42-43页
第五章 结论与展望第43-45页
    5.1 本文主要完成的工作及结论第43-44页
    5.2 研究过程中存在的问题及对后续工作的展望第44-45页
参考文献第45-49页
作者在读期间发表的学术论文第49-50页
致谢第50-51页

论文共51页,点击 下载论文
上一篇:“关联耦合”视角下城市公共空间整合研究
下一篇:基于可持续利用的售楼中心设计研究