首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于用户评论数据的信息提炼技术研究

致谢第4-5页
摘要第5-6页
Abstract第6-7页
1 绪论第11-25页
    1.1 研究背景及意义第11-15页
        1.1.1 研究背景第11-13页
        1.1.2 研究意义第13-15页
    1.2 国内外研究现状第15-21页
        1.2.1 数据采集研究现状第15-16页
        1.2.2 数据挖掘研究现状第16-17页
        1.2.3 特征提取与情感分析第17-21页
            1.2.3.1 国外研究现状第17-19页
            1.2.3.2 国内研究现状第19-21页
    1.3 论文框架第21-24页
        1.3.1 存在问题第21页
        1.3.2 研究内容第21-24页
    1.4 本章小结第24-25页
2 基于元素定位的文本数据采集第25-35页
    2.1 网络爬虫原理第25-26页
    2.2 网页元素定位数据采集理论基础第26-29页
        2.2.1 Selenium工具简介第26-27页
        2.2.2 定位特性第27-28页
        2.2.3 Java中配置Selenium第28-29页
    2.3 基于Hibernate框架的数据存储第29-34页
        2.3.1 Hibernate基本原理第29-31页
        2.3.2 Hibernate存储框架算法的实现第31-32页
        2.3.3 最终需求环境配置第32-34页
    2.4 本章小结第34-35页
3 基于最大概率链分词的特征提取第35-43页
    3.1 分词环境介绍第35-36页
    3.2 最大概率链分词第36-39页
        3.2.1 分词原理第36-38页
        3.2.2 分词步骤第38页
        3.2.3 系统词典补充第38-39页
    3.3 特征提取第39-42页
        3.3.1 词频统计第39-40页
        3.3.2 信息增益第40页
        3.3.3 CHI统计第40-41页
        3.3.4 互信息第41-42页
        3.3.5 特征提取方法选取第42页
    3.4 本章小结第42-43页
4 基于逐级词性匹配的文本情感量化方法第43-53页
    4.1 文本类数据情感分析方法第43-45页
    4.2 情感分析算法第45-46页
    4.3 改进的词性匹配情感分析第46-52页
        4.3.1 词语情感第46-48页
        4.3.2 短语情感第48-50页
            4.3.2.1 贬义对象第48-49页
            4.3.2.2 程度词语第49-50页
            4.3.2.3 引号与极性词组合第50页
        4.3.3 句子情感第50-51页
        4.3.4 情感语句模型第51-52页
    4.4 本章小结第52-53页
5 用户评论的数据挖掘系统设计第53-70页
    5.1 系统总体实现框架第53-54页
    5.2 数据采集实现第54-60页
    5.3 数据清洗及预处理第60-62页
        5.3.1 噪声与干扰项的清洗第60-61页
        5.3.2 数据格式预处理第61-62页
    5.4 特征提取实现第62-64页
        5.4.1 特征提取试验规则及结果展示第62-64页
        5.4.2 特征结果试验结果分析第64页
    5.5 情感分析实现第64-69页
        5.5.1 情感分析的前处理第65-66页
        5.5.2 试验结果分析及对比第66-69页
    5.6 本章小结第69-70页
6 总结与展望第70-72页
    6.1 本文总结第70-71页
    6.2 未来展望第71-72页
参考文献第72-76页

论文共76页,点击 下载论文
上一篇:面向皮肤组织工程的水凝胶与细胞打印研究
下一篇:高速电梯轿厢气压变化规律建模与补偿设计分析及其应用