首页--文化、科学、教育、体育论文--信息与知识传播论文--图书馆学、图书馆事业论文--文献标引与编目论文

基于语义和引用加权的文献主题提取研究

致谢第4-5页
摘要第5-6页
Abstract第6页
1 绪论第9-14页
    1.1 研究背景及意义第9-11页
        1.1.1 研究背景第9-11页
        1.1.2 研究意义第11页
    1.2 研究内容及创新性第11-12页
        1.2.1 研究内容第11-12页
        1.2.2 研究创新性第12页
    1.3 本文组织结构第12-14页
2 国内外研究综述第14-26页
    2.1 国内外著作、文献检索情况第14-15页
    2.2 国内外研究现状第15-24页
        2.2.1 基于加权算法的主题提取第15-18页
        2.2.2 基于本体或知识库的主题提取第18-21页
        2.2.3 基于主题概率模型的主题提取第21-24页
    2.3 本章小结第24-26页
3 基于语义的主题提取技术第26-35页
    3.1 隐性语义索引第27页
    3.2 概率隐性语义索引第27-28页
    3.3 LDA模型第28-32页
    3.4 Labeled-LDA模型第32-34页
    3.5 本章小结第34-35页
4 基于语义和引用加权的主题提取模型第35-46页
    4.1 基于引用加权的主题提取流程第35-36页
    4.2 词频/逆文档频率(TF-IDF)第36-37页
    4.3 基于引用内容的引文网络第37-41页
        4.3.1 文献之间的联系程度第38-39页
        4.3.2 基于全文数据的引文分析第39-41页
    4.4 基于引文的概率主题模型第41-42页
    4.5 聚类及主题提取第42-45页
        4.5.1 K-means聚类算法第42-44页
        4.5.2 主题提取第44-45页
    4.6 本章小结第45-46页
5 实验与分析第46-56页
    5.1 数据来源第46页
    5.2 数据获取第46-50页
        5.2.1 标签(Label)的获取第47-49页
        5.2.2 引用内容的获取第49-50页
    5.3 基于Labeled-LDA模型的数据第50-52页
        5.3.1 基于引文的概率模型数据第51-52页
    5.4 聚类结果第52页
    5.5 主题提取第52-54页
    5.6 分析第54-55页
    5.7 本章小结第55-56页
6 总结与展望第56-58页
    6.1 总结与讨论第56-57页
    6.2 不足第57页
    6.3 展望第57-58页
参考文献第58-64页
附录第64-69页
    附录1 72663条引用内容的主题概率分布第64-67页
    附录2 1791篇文档的主题概率分布第67-69页

论文共69页,点击 下载论文
上一篇:我国档案捐赠工作研究
下一篇:深圳公交移动电视竞争力调查与分析