首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于文本挖掘的生物命名实体识别算法研究

摘要第5-7页
abstract第7-8页
第一章 绪论第11-27页
    1.1 研究背景与意义第11-13页
    1.2 研究现状第13-24页
        1.2.1 命名实体识别第13-18页
            1.2.1.1 有监督学习第14-16页
            1.2.1.2 半监督学习第16-17页
            1.2.1.3 无监督学习第17-18页
        1.2.2 迁移学习第18-23页
        1.2.3 正例未标注学习第23-24页
    1.3 现有研究存在的问题与不足第24-25页
    1.4 研究内容第25-26页
    1.5 论文组织结构第26-27页
第二章 基于迁移学习的生物医学蛋白质命名实体识别第27-59页
    2.1 隐马尔科夫模型第28-37页
        2.1.1 隐马尔科夫模型的定义第28-29页
        2.1.2 隐马尔科夫模型的基本问题第29-37页
            2.1.2.1 概率计算问题第29-33页
                (1) 直接计算法第29-30页
                (2) 前向算法第30-32页
                (3) 后向算法第32-33页
            2.1.2.2 学习问题第33-36页
                (1) 监督学习方法第33页
                (2) Baum-Welch算法第33-36页
            2.1.2.3 预测问题第36-37页
                (1) 近似算法第36页
                (2) 维特比算法第36-37页
    2.2 问题定义第37-38页
    2.3 方法概述与流程第38-46页
        2.3.1 基于实例的数据迁移第39-42页
            2.3.1.1 计算相似度第40-41页
                (1) 单词结构相似性第40-41页
                (2) 编辑距离第41页
            2.3.1.2 计算权值第41-42页
        2.3.2 BioTrHMM的学习算法第42-44页
        2.3.3 BioTrHMM的分类算法第44-46页
    2.4 实验及结果分析第46-58页
        2.4.1 语料库介绍第46-48页
        2.4.2 性能评估第48-49页
        2.4.3 实验设置第49-50页
        2.4.4 实验结果分析第50-58页
            2.4.4.1 针对a的实验第50-51页
            2.4.4.2 针对ab的实验第51页
            2.4.4.3 针对g的实验第51-58页
    2.5 本章小结第58-59页
第三章 基于PU学习的生物医学蛋白质命名实体识别第59-77页
    3.1 问题定义第60页
    3.2 方法概述与流程第60-61页
    3.3 数据集构建第61-62页
    3.4 构建分类模型第62-70页
        3.4.1 分类强负例第63-69页
            3.4.1.1 Rocchio算法第63-65页
            3.4.1.2 朴素贝叶斯算法第65-66页
            3.4.1.3 Spy技术第66-68页
            3.4.1.4 1 -DNF方法第68-69页
        3.4.2 构建分类模型第69-70页
    3.5 实验设置第70页
    3.6 实验及结果分析第70-76页
        3.6.1 针对参数Unlevel的实验第71-73页
        3.6.2 针对参数a的实验第73-75页
        3.6.3 与BioTrHMM算法的对比实验第75-76页
    3.7 本章小结第76-77页
第四章 总结与展望第77-79页
    4.1 结论第77页
    4.2 未来工作第77-79页
参考文献第79-87页
致谢第87-88页
作者简介第88页

论文共88页,点击 下载论文
上一篇:基于位置层次化约束的布料动态模拟研究
下一篇:复杂背景下视频人脸实时跟踪算法研究