首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于互联网文本的企业间关系挖掘技术研究及应用

摘要第5-6页
Abstract第6页
第一章 绪论第10-17页
    1.1 研究背景和意义第10-11页
    1.2 国内外研究现状第11-14页
    1.3 本文研究的主要内容第14-15页
    1.4 论文结构第15-17页
第二章 数据预处理和企业命名实体识别第17-25页
    2.1 任务分析第17页
    2.2 语义特征向量第17页
    2.3 本文所用的自然语言处理框架介绍第17-18页
        2.3.1 StanfordNLP第17-18页
        2.3.2 GATE第18页
        2.3.3 Word2Vec第18页
    2.4 关键步骤的实现第18-22页
        2.4.1 停用词的过滤第18-19页
        2.4.2 文本的分词、分句和词性标注第19-20页
        2.4.3 实体类型的判断和提取第20-21页
        2.4.4 企业实体语义特征向量的获取第21-22页
    2.5 Word2Vec WebService的搭建第22-23页
        2.5.1 任务分析第22页
        2.5.2 gSoap构建服务端第22-23页
        2.5.3 Java Axis构建客户端第23页
    2.6 预处理中遇到的瓶颈及解决方案第23-24页
    2.7 本章小结第24-25页
第三章 企业关系二元组的生成第25-29页
    3.1 任务分析第25页
    3.2 相似度方法选取第25-26页
    3.3 关系二元组生成的实现第26-27页
        3.3.1 读入实体集第26页
        3.3.2 相似度计算第26页
        3.3.3 结果过滤第26-27页
    3.4 二元组存储设计第27-28页
    3.5 本章小结第28-29页
第四章 基于指示词的企业关系分类第29-38页
    4.1 任务分析第29-30页
    4.2 分类框架设计第30-31页
    4.3 关键步骤的实现第31-37页
        4.3.1 训练集标注第31-32页
        4.3.2 指示词的获取和扩展第32页
        4.3.3 指示词权重衡量第32-37页
        4.3.4 企业关系类型分类第37页
    4.4 本章小结第37-38页
第五章 方法测试及结果分析第38-46页
    5.1 实验数据第38-39页
        5.1.1 语料库的构建方法第38页
        5.1.2 实验数据概述第38-39页
    5.2 验证方法第39页
    5.3 验证指标第39页
    5.4 实验环境第39-40页
    5.5 实验结果与分析第40-45页
        5.5.1 不同权重衡量方法的结果评估第40-41页
        5.5.2 信息窗口W对结果的影响分析第41-42页
        5.5.3 权重衰减系数R对结果的影响分析第42-43页
        5.5.4 近义词树深度d对结果的影响分析第43-44页
        5.5.5 语义相似度与关系强度的关联分析第44-45页
    5.6 本章小节第45-46页
第六章 关系挖掘系统的设计和关系可视化第46-52页
    6.1 任务分析第46页
    6.2 系统架构设计概述第46-47页
    6.3 过滤器的设计第47-48页
        6.3.1 ProcessOriDoc语料库文本预处理过滤器第47页
        6.3.2 FindRelations企业关系二元组生成过滤器第47页
        6.3.3 IdentifyRelation基于指示词的企业关系分类过滤器第47-48页
    6.4 系统线程池设计第48-49页
    6.5 关系可视化第49-51页
    6.6 本章小结第51-52页
第七章 总结与展望第52-54页
    7.1 总结第52-53页
    7.2 展望第53-54页
参考文献第54-58页
攻读硕士学位期间取得的研究成果第58-59页
致谢第59-60页
附件第60页

论文共60页,点击 下载论文
上一篇:基于SpringMVC的高校信息综合管理系统设计与实现
下一篇:面向新闻话题的事件演变与舆情分析技术研究与运用