首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

短文本中特殊信息的识别及其在数据挖掘引擎中的应用

摘要第4-5页
Abstract第5页
第一章 绪论第8-13页
    1.1 课题研究背景与意义第8-9页
    1.2 国内外研究状况第9-11页
    1.3 本文主要研究内容第11页
    1.4 本文组织结构第11-13页
第二章 相关支撑技术第13-21页
    2.1 语义网络第13-17页
        2.1.1 语义网络第13-14页
        2.1.2 实体与关系第14-17页
    2.2 本研究所基于的数据平台第17-20页
        2.2.1 Hadoop第17-18页
        2.2.2 MapReduce第18-20页
    2.3 本章小结第20-21页
第三章 基于角色标注的中国人名自动识别第21-37页
    3.1 中文分词和命名实体的识别第21-25页
        3.1.1 中文分词技术第21-22页
        3.1.2 最大匹配法第22-23页
        3.1.3 N-最短路径分词算法第23-25页
    3.2 基于HMM的标注模型第25-31页
        3.2.1 隐马尔可夫模型第25-28页
        3.2.2 Viterbi算法实现角色标注识别第28-31页
    3.3 中文人名识别第31-36页
        3.3.1 角色自动识别算法实现第31-32页
        3.3.2 参数估计与平滑处理第32-35页
        3.3.3 性能分析与对比第35-36页
    3.4 本章小结第36-37页
第四章 地址名和账号类实体抽取识别第37-55页
    4.1 基于FSM和地名词典的地名识别第37-41页
        4.1.1 中文地址名的特点第37页
        4.1.2 有限状态机第37-40页
        4.1.3 地名词典和后缀关键字触发第40-41页
    4.2 规则库的建立第41-47页
        4.2.1 产生式规则第41-42页
        4.2.2 规则引擎第42-45页
        4.2.3 规则的获取和规则库的组织管理第45-47页
    4.3 基于规则库的账号类实体抽取第47-54页
        4.3.1 规则的添加第47-50页
        4.3.2 应用举例第50-54页
    4.4 本章小结第54-55页
第五章 敏感信息的查询和分析系统第55-63页
    5.1 系统功能第55-56页
    5.2 系统总体架构第56页
    5.3 系统模块分析第56-60页
    5.4 系统用户界面第60-62页
    5.5 本章小结第62-63页
第六章 总结与展望第63-65页
    6.1 本文总结第63页
    6.2 工作展望第63-65页
参考文献第65-68页
附录1 图表清单第68-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:基于Hadoop的ETL部件在分布式数据挖掘引擎中的应用
下一篇:社交网络中基于聚类分析的可信推荐系统