首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于网络影评文本的关系图谱系统的设计与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-13页
    1.1 研究背景和研究意义第10-11页
    1.2 本文的主要工作第11页
    1.3 本文组织结构以及章节安排第11-13页
第二章 相关技术研究第13-23页
    2.1 关系图谱概述第13-14页
    2.2 基于文本的关系抽取第14-15页
    2.3 文本相似度计算第15-16页
    2.4 数据爬取技术研究第16-18页
    2.5 文本分词技术第18页
    2.6 文本向量技术研究第18-22页
        2.6.1 词袋模型第18-19页
        2.6.2 基于LDA主题模型的文本向量第19-20页
        2.6.3 词向量技术研究第20-21页
        2.6.4 神经语言模型获取distributed representations词向量第21-22页
        2.6.5 段落向量技术研究第22页
    2.7 本章小结第22-23页
第三章 关系图谱系统的设计与实现第23-42页
    3.1 数据源调研与分析第23-25页
    3.2 数据爬取设计与实现第25-30页
        3.2.1 数据爬取概述第25-26页
        3.2.2 电影种子URL抓取第26-27页
        3.2.3 影评信息抓取第27-28页
        3.2.4 高效应对目标网站的反爬虫策略第28-29页
        3.2.5 数据更新第29-30页
    3.3 数据预处理第30-33页
        3.3.1 文本分词构建词汇表第30-32页
        3.3.2 构建词汇表哈夫曼树第32-33页
    3.4 词向量计算的设计与实现第33-36页
        3.4.1 word2vec模型和训练方法第33-35页
        3.4.2 基于word2vec模型的词向量融合第35-36页
        3.4.3 词向量计算的相关参数和边界问题第36页
    3.5 段落向量计算的设计与实现第36-40页
        3.5.1 词向量叠加生成段落向量第38页
        3.5.2 句向量的分布记忆模型生成段落向量以及改进第38-40页
    3.6 文本关联计算设计与实现第40-41页
    3.7 本章小结第41-42页
第四章 实验分析第42-53页
    4.1 实验环境第42-44页
        4.1.1 实验系统环境第42-43页
        4.1.2 实验软件环境第43-44页
    4.2 数据爬取分析第44-45页
    4.3 词向量计算分析第45-46页
    4.4 段落向量计算计算分析第46-47页
    4.5 关系图谱计算分析第47-52页
        4.5.1 标记数据集的获取第47-48页
        4.5.2 不同模型的统计数据比对第48-50页
        4.5.3 关系图谱结果展示第50-52页
    4.6 本章小结第52-53页
第五章 总结与展望第53-55页
    5.1 本文工作总结第53-54页
    5.2 未来研究工作展望第54-55页
参考文献第55-57页
致谢第57-58页
作者攻读学位期间发表的学术论文和科研情况第58页

论文共58页,点击 下载论文
上一篇:光纤无线通信系统中光载毫米波数字信号倍频产生技术研究
下一篇:用户体验分析系统异网宽带分析子系统的设计与实现