首页--文化、科学、教育、体育论文--科学、科学研究论文--情报学、情报工作论文--情报资料的处理论文--情报资料的分析和研究论文

学术论文被引语句的识别方法研究

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第11-26页
    1.1 研究背景与研究意义第11-13页
        1.1.1 研究背景第11-12页
        1.1.2 研究目的和意义第12-13页
    1.2 国内外研究现状第13-20页
        1.2.1 引文内容分析第13-14页
        1.2.2 引文内容分析的功能应用第14-19页
        1.2.3 被引文献主要内容获取的研究现状第19-20页
    1.3 研究内容和内容安排第20-22页
        1.3.1 研究内容第20-21页
        1.3.2 内容安排第21-22页
    1.4 数据来源与研究方法第22-25页
        1.4.1 数据来源第22-23页
        1.4.2 研究方法第23-25页
    1.5 创新点第25-26页
第2章 文本相似度理论基础第26-31页
    2.1 文本相似度基本概念第26-27页
        2.1.1 文本相似度第26页
        2.1.2 本文理解的文本相似度第26-27页
        2.1.3 相似度算法特性第27页
    2.2 文本相似度计算步骤第27-30页
        2.2.1 文本预处理第27-28页
        2.2.2 文本特征项提取及特征项的权重计算第28-29页
        2.2.3 文本相似度计算第29-30页
    2.3 本章小结第30-31页
第3章 文本相似度算法研究第31-39页
    3.1 基于向量空间模型(VSM)的文本相似度算法第31-36页
        3.1.1 向量空间模型的基本思路第31-32页
        3.1.2 特征项提取第32页
        3.1.3 特征项权重的计算方法第32-33页
        3.1.4 文本相似度衡量第33-35页
        3.1.5 基于VSM的文本相似度算法的特点第35-36页
    3.2 基于潜在语义索引(LSI)的文本相似度算法第36-38页
        3.2.1 潜在语义索引的基本思路第36页
        3.2.2 算法步骤第36-38页
        3.2.3 基于LSI的文本相似度算法的特点第38页
    3.3 本章小结第38-39页
第4章 被引语句识别的实验方案设计第39-63页
    4.1 被引语句识别方法的框架搭建第39-46页
        4.1.1 需求分析和识别框架第39-40页
        4.1.2 数据层:数据集的构建第40-42页
        4.1.3 数据层:数据集的存储第42页
        4.1.4 用户层:引用出处的获取第42-43页
        4.1.5 用户层:被引语句的识别第43-46页
    4.2 基于VSM与LSI相似度算法的中文被引语句识别方法第46-49页
        4.2.1 方法思路第46-47页
        4.2.2 实现流程第47-49页
    4.3 构建实验数据集模块第49-51页
    4.4 获取引用出处模块第51-62页
        4.4.1 中文分词第51-53页
        4.4.2 词性标注第53-55页
        4.4.3 构建文本向量第55-60页
        4.4.4 相似度计算第60-62页
    4.5 本章小结第62-63页
第5章 被引语句识别实验与实验结果评估第63-75页
    5.1 实验方案第63页
        5.1.1 实验目的第63页
        5.1.2 实验对象的选择第63页
    5.2 实验工具与运行环境第63-64页
    5.3 实验过程第64-66页
        5.3.1 数据采集第64-65页
        5.3.2 数据处理第65-66页
    5.4 实验结果与分析第66-73页
        5.4.1 性能比较第67-68页
        5.4.2 准确率曲线比较第68-70页
        5.4.3 LSI算法中k的取值第70-73页
    5.5 算法效果总结第73-74页
    5.6 本章小结第74-75页
第6章 总结与展望第75-77页
参考文献第77-83页
附录第83-91页
    附录1:被引文献集(ArticleSet)第83-85页
    附录2:被引文献篇幅及其引文内容数量第85-87页
    附录3:VSM、LSI算法结果的准确率、召回率、F1值第87-89页
    附录4:最优k值、被引文献文章篇幅以及特征项数量第89-91页
致谢第91-92页
读研期间发表论文情况一览表第92页

论文共92页,点击 下载论文
上一篇:中美公共图书馆活动调查与比较研究
下一篇:英国高校学生信息素养培养的研究