首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向民族信息资源领域的非结构化数据语义关系挖掘

摘要第3-4页
Abstract第4页
第1章 绪论第8-14页
    1.1 研究意义第8-9页
    1.2 国内外研究现状及发展动态第9-12页
    1.3 论文研究内容第12-13页
    1.4 论文结构第13-14页
第2章 相关方法介绍第14-23页
    2.1 分词歧义处理方法第14-15页
        2.1.1 分词粗分方法第14页
        2.1.2 分词歧义类型第14-15页
    2.2 新词发现方法第15-16页
    2.3 命名实体识别及词性标注方法第16-18页
    2.4 实体关系抽取方法第18-21页
        2.4.1 基于规则匹配的方法第18-19页
        2.4.2 基于机器学习的方法第19-21页
    2.5 基于Hadoop的云计算技术第21-23页
        2.5.1 HDFS分布式文件系统第21-22页
        2.5.2 MapReduce计算框架第22-23页
第3章 民族信息领域中的分词歧义处理第23-28页
    3.1 交集型歧义处理第23-26页
        3.1.1 交集型歧义识别第23-24页
        3.1.2 卡方统计量第24-25页
        3.1.3 t-测试第25页
        3.1.4 联合卡方统计量和t-测试差第25-26页
    3.2 实验结果及分析第26-28页
第4章 新词识别中的多特征海量数据的并行化第28-37页
    4.1 候选词切分及新词特征选择第28-29页
    4.2 MapReduce并行计算模型第29-34页
        4.2.1 字符串频次并行化第29-31页
        4.2.2 上下文熵并行化第31-32页
        4.2.3 卡方统计量并行化第32-34页
        4.2.4 多特征数据联结第34页
    4.3 实验结果及分析第34-37页
第5章 基于无监督学习的实体关系挖掘第37-43页
    5.1 实体对抽取第37-38页
    5.2 实体对上下文特征提取第38-39页
    5.3 特征向量距离中的语义相似度计算第39-40页
    5.4 特征向量的聚类第40-41页
    5.5 实验结果及分析第41-43页
第6章 民族信息领域非结构化数据语义关系挖掘平台第43-48页
    6.1 平台总体介绍第43-44页
    6.2 平台功能详细介绍第44-48页
        6.2.1 网络爬虫功能第45页
        6.2.2 文本分类功能第45-46页
        6.2.3 文本语义挖掘功能第46-47页
        6.2.4 实体关系挖掘训练语料库制作第47-48页
第7章 总结与展望第48-49页
    7.1 全文总结第48页
    7.2 展望第48-49页
参考文献第49-51页
致谢第51-52页
攻读学位期间发表的论文和研究成果第52页

论文共52页,点击 下载论文
上一篇:邯郸市餐饮企业凉菜卫生状况调查与分析
下一篇:论王九思对杜甫诗歌的接受