首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

大数据环境下的用户信息抽取与分析

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-18页
    1.1 研究背景及意义第10-11页
    1.2 研究现状第11-15页
        1.2.1 信息抽取的研究现状第11-13页
        1.2.2 文本分类的研究现状第13页
        1.2.3 用户职业抽取及人才圈发现现状第13-14页
        1.2.4 研究现状总结第14-15页
    1.3 论文主要工作第15页
    1.4 论文的组织结构第15-18页
第二章 关键技术介绍第18-26页
    2.1 信息抽取相关技术第18-19页
    2.2 文本处理及特征选择第19-22页
        2.2.1 文本预处理第19-20页
        2.2.2 特征选择第20-21页
        2.2.3 文本向量化第21-22页
    2.3 相关文本分类算法第22-24页
    2.4 相关聚类算法第24页
    2.5 评估方法第24-25页
    2.6 本章小结第25-26页
第三章 基于远监督的混合神经网络关系抽取第26-42页
    3.1 数据获取及预处理第26-28页
    3.2 关系知识库的构建第28-33页
        3.2.1 获取关系三元组第28-30页
        3.2.2 关系三元组扩展及训练语料优化第30-33页
    3.3 混合神经网络抽取模型第33-36页
    3.4 实验结果与分析第36-39页
    3.5 本章小结第39-42页
第四章 基于多源特征的关系抽取第42-56页
    4.1 数据集的构建第42-44页
        4.1.1 数据采集第42-43页
        4.1.2 数据预处理第43-44页
    4.2 特征抽取及优化第44-50页
        4.2.1 用户层特征抽取第44-47页
        4.2.2 网络层特征抽取第47-50页
    4.3 实验结果与分析第50-54页
    4.4 本章小结第54-56页
第五章 基于聚类的人才圈发现第56-76页
    5.1 需求分析及概要设计第56-58页
    5.2 用户相似性模型第58-62页
    5.3 人才圈发现详细设计第62-70页
        5.3.1 数据层第62-64页
        5.3.2 特征层第64-67页
        5.3.3 模型层第67-68页
        5.3.4 相似性计算层第68-69页
        5.3.5 聚类层第69-70页
    5.4 人才圈发现服务测试第70-74页
        5.4.1 逻辑回归特征选择第71-72页
        5.4.2 测试结果第72-74页
    5.5 本章小结第74-76页
第六章 总结和展望第76-78页
    6.1 工作总结第76页
    6.2 展望第76-78页
参考文献第78-84页
致谢第84-86页
攻读学位期间发表的学术论文第86页

论文共86页,点击 下载论文
上一篇:一种全局数据流分析方法研究及实现
下一篇:特种设备事故及故障事件舆情监测分析系统的设计与实现