首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文实体集合自动扩展技术研究

摘要第8-9页
Abstract第9页
1 绪论第10-14页
    1.1 中文实体集合扩展技术的概述第10页
    1.2 研究背景及意义第10-11页
    1.3 国内外研究现状第11页
    1.4 研究的难点和问题第11-12页
    1.5 论文的组织结构第12-14页
2 实体集合扩展相关技术的研究第14-25页
    2.1 实体集合扩展技术概述第14-15页
    2.2 实体集合扩展技术的分类第15-17页
        2.2.1 基于模板的方法第15-16页
        2.2.2 基于分布的方法第16页
        2.2.3 基于融合的方法第16-17页
    2.3 基于最大相似上下文的模版第17-19页
        2.3.1 包装器(Wrapper)概述第17-18页
        2.3.2 利用包装器进行模式匹配第18-19页
    2.4 经典的过滤噪音的方法第19-22页
        2.4.1 语境特征提纯法第20-21页
        2.4.2 聚类提纯法第21-22页
    2.5 孤立点分析第22-23页
    2.6 本章小结第23-25页
3 直角坐标系面积法第25-39页
    3.1 基于包装器的扩展法第25页
    3.2 基于图游走的打分排序法第25-27页
        3.2.1 难点分析第25-26页
        3.2.2 基于图游走的过滤法第26-27页
    3.3 直角坐标系特性第27-28页
    3.4 难点概述第28-31页
        3.4.1 代表性的研究第28-29页
        3.4.2 覆盖范围的研究第29-30页
        3.4.3 歧义的研究第30-31页
    3.5 直角坐标系面积算法描述第31-34页
        3.5.1 定义直角坐标系第31页
        3.5.2 构建直角坐标系第31-33页
        3.5.3 四边形面积法第33-34页
    3.6 融合语境相似度第34-35页
    3.7 实验结果及分析第35-37页
        3.7.1 语料与评价标准第35页
        3.7.2 实验结果及分析第35-37页
    3.8 本章小结第37-39页
4 融合语义信息的实体集合扩展法第39-48页
    4.1 维基百科(Wikipedia)概述第39-40页
    4.2 维基百科的特点第40-43页
        4.2.1 重定向页第40页
        4.2.2 消除歧义页第40-41页
        4.2.3 分类第41页
        4.2.4 超链接第41页
        4.2.5 维基百科在科研领域的应用第41-43页
    4.3 百度百科及其包含的语义知识第43-44页
        4.3.1 百度百科概述第43-44页
        4.3.2 百度百科所蕴含的语义知识第44页
    4.4 基于模版的扩展法第44页
    4.5 语义过滤算法的描述第44-46页
        4.5.1 语义阶段第45页
        4.5.2 提纯阶段第45页
        4.5.3 选取阶段第45-46页
    4.6 实验数据及分析第46-47页
    4.7 本章小结第47-48页
5 总结与展望第48-49页
    5.1 总结第48页
    5.2 展望第48-49页
参考文献第49-53页
致谢第53页

论文共53页,点击 下载论文
上一篇:网管障碍派发及资源管理系统的开发
下一篇:财富管理与消费者保护国际经验研究与借鉴