首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本信息自动标引技术研究与改进

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-17页
    1.1 自动标引技术研究背景和意义第9-10页
    1.2 国内外研究现状第10-15页
        1.2.1 自动标引技术的国外研究情况第10-13页
        1.2.2 自动标引技术国内研究现状第13-15页
    1.3 本文具体研究内容与构成章节第15-17页
第2章 自动标引技术和相关概念第17-30页
    2.1 自动标引技术应用第17-19页
    2.2 自动标引主体的界定第19-22页
        2.2.1 自动标引主体相关概念第19-22页
        2.2.2 自动标引主体的界定第22页
    2.3 自动标引的最基本流程第22-26页
    2.4 中文分词研究第26-29页
        2.4.1 基于字符串匹配分词算法第26-27页
        2.4.2 基于统计的分词法第27-28页
        2.4.3 基于理解的分词方法第28页
        2.4.4 混合方法第28-29页
    2.5 本章小结第29-30页
第3章 生成候选关键短语集的改进方法第30-44页
    3.1 识别候选短语的相关研究第30-32页
        3.1.1 基于n-gram法的研究情况第30-32页
        3.1.2 基于POS序列法的研究情况第32页
    3.2 通过核心单词来定位候选短语第32-35页
        3.2.1 核心单词集法提出的思路第32-33页
        3.2.2 核心单词与关键短语的关系第33-34页
        3.2.3 核心单词集的获取第34-35页
    3.3 候选关键短语的形成算法第35-43页
        3.3.1 基于n-gram法得到核心单词及潜在候选短语第35-36页
        3.3.2 核心单词前拓展树算法的基本思路第36-39页
        3.3.3 后拓展树算法第39页
        3.3.4 算法测试运行结果第39-42页
        3.3.5 前(后)拓展树算法与基于n-gram法的比较分析第42-43页
    3.4 本章小结第43-44页
第4章 基于TF-IDF统计法自动抽取关键词的改进多特征融合法第44-51页
    4.1 基于词汇分布特征统计自动抽取关键词的研究方法第44-47页
        4.1.1 词频统计标引法(绝对频率加权法)第45-46页
        4.1.2 加权统计标引法第46-47页
    4.2 基于TF-IDF的多特征融合算法第47-49页
        4.2.1 TF-IDF算法公式的改进第48页
        4.2.2 词性特征第48-49页
        4.2.3 位置特征第49页
    4.3 基于TF-IDF多特征融合算法的改进第49-50页
        4.3.1 互信息第49-50页
        4.3.2 改进的多特征融合算法第50页
    4.4 本章小结第50-51页
第5章 改进的多特征融合算法数值实验第51-58页
    5.1 实验过程第51-55页
        5.1.1 算法流程第51页
        5.1.2 算法的具体实现第51-54页
        5.1.3 实验安排第54-55页
    5.2 实验结果分析第55-57页
    5.3 本章小结第57-58页
第6章 总结与展望第58-60页
    6.1 主要工作和创新点第58-59页
    6.2 未来的研究工作第59-60页
参考文献第60-64页
硕士学攻读位期间发表论文及参与项目情况第64-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:基于SOA的医院信息系统集成应用研究
下一篇:基于小波变换的图像去噪与融合算法研究