首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于社交网站的数据挖掘应用研究--主题分析

摘要第4-5页
Abstract第5页
专用术语注释表第8-9页
第一章 背景综述第9-12页
    1.1 背景与现状第9-10页
    1.2 国内外研究现状第10-11页
    1.3 本系统的目标与内容第11页
    1.4 本文的组织结构第11-12页
第二章 本系统的关键技术第12-22页
    2.1 自然语言处理与数据挖掘第12-14页
        2.1.1 自然语言处理第12-13页
        2.1.2 数据挖掘技术第13-14页
    2.2 中文分词技术第14-16页
        2.2.1 基于字符串匹配的分词第14-15页
        2.2.2 基于统计的分词第15-16页
        2.2.3 基于知识理解的分词第16页
    2.3 主题模型理论第16-21页
        2.3.1 概率主题模型第17-19页
        2.3.2 多项分布和 Dirichlet 分布第19页
        2.3.3 期望最大化第19-21页
    2.4 本章小结第21-22页
第三章 基于条件随机场的中文分词系统第22-39页
    3.1 条件随机场第22-32页
        3.1.1 隐马尔可夫模型第22-27页
        3.1.2 最大熵模型第27-29页
        3.1.3 最大熵马尔可夫模型第29-31页
        3.1.4 条件随机场模型第31-32页
    3.2 基于 CRFs 的中文分词技术第32-34页
        3.2.1 汉字标注第32-33页
        3.2.2 特征选择第33-34页
    3.3 CRFs 分词系统第34-38页
        3.3.1 CRFs 分词系统设计第34页
        3.3.2 分词系统模块介绍及功能实现第34-38页
    3.4 本章小结第38-39页
第四章 基于 LDA 模型的主题分析系统第39-51页
    4.1 LDA 主题模型第39-44页
        4.1.1 隐含变量模型第39-41页
        4.1.2 LDA 模型第41-44页
    4.2 模型的推导第44-47页
        4.2.1 变分推理第44-45页
        4.2.2 吉布斯抽样算法第45-47页
    4.3 主题的内聚度与耦合度第47-49页
        4.3.1 主题的内聚度第48页
        4.3.2 主题的耦合度第48-49页
    4.4 主题分析系统的实验设计第49-50页
        4.4.1 基于 LDA 模型的主题分析系统框架设计第49页
        4.4.2 主题分析系统功能模块介绍第49-50页
    4.5 本章小结第50-51页
第五章 实验结果分析第51-60页
    5.1 实验数据与实验环境第51-53页
        5.1.1 实验数据第51-52页
        5.1.2 实验环境及模块第52-53页
    5.2 系统的设计与实验结果第53-59页
        5.2.1 实验设计第53-56页
        5.2.2 结果分析第56-59页
    5.3 本章小结第59-60页
第六章 总结与展望第60-62页
    6.1 本文研究总结第60-61页
    6.2 未来工作展望第61-62页
参考文献第62-65页
附录 1 程序清单第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:招商银行私人银行业务发展模式创新研究
下一篇:异构无线网络中联合无线资源管理技术研究