首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于图与LDA的中文文本关键词提取算法

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第11-17页
    1.1 引言第11页
    1.2 关键词提取的研究背景与意义第11-12页
    1.3 国内外研究现状第12-15页
        1.3.1 关键词提取的定义第12-13页
        1.3.2 关键词提取的算法第13-15页
    1.4 本文的主要研究内容与创新点第15-16页
    1.5 本文的组织结构第16页
    1.6 本章小结第16-17页
第二章 相关技术与概念第17-31页
    2.1 数据挖掘相关知识第17-20页
        2.1.1 数据挖掘的概念第17-18页
        2.1.2 数据挖掘的过程第18页
        2.1.3 数据挖掘的常用方法第18-19页
        2.1.4 数据挖掘的应用场景第19-20页
    2.2 关键词提取的流程与方法第20-30页
        2.2.1 语料确定与获取第20页
        2.2.2 文本分词第20-22页
        2.2.3 候选词的确定第22页
        2.2.4 候选词的特征与表示第22-29页
        2.2.5 算法设计第29页
        2.2.6 算法评估第29-30页
    2.3 本章小结第30-31页
第三章 基于词句协同的中文文本关键词提取算法第31-45页
    3.1 TextRank及相关算法第31-34页
        3.1.1 PageRank第31-32页
        3.1.2 TextRank第32-33页
        3.1.3 SingleRank第33页
        3.1.4 HMM-Rank第33-34页
    3.2 基于词句协同的关键词提取算法第34-38页
        3.2.1 算法思想第34页
        3.2.2 文本预处理第34-35页
        3.2.3 候选词的扩散度定义第35页
        3.2.4 构建文本网络第35页
        3.2.5 候选词初步得分第35-36页
        3.2.6 句子BM25相关性计算第36-37页
        3.2.7 候选词最终得分第37-38页
    3.3 实验与评估第38-44页
        3.3.1 实验材料与环境第38页
        3.3.2 评估方法第38-39页
        3.3.3 实验结果与分析第39-44页
    3.4 本章小结第44-45页
第四章 基于LDA主题模型的中文文本关键词提取算法第45-58页
    4.1 主题模型第45-51页
        4.1.1 主题模型发展第45-46页
        4.1.2 隐含狄利克雷分配模型第46-48页
        4.1.3 吉布斯采样求解LDA模型第48-51页
    4.2 基于LDA主题模型的中文关键词提取算法第51-52页
        4.2.1 算法思想第51页
        4.2.2 算法设计第51-52页
    4.3 实验与评估第52-57页
        4.3.1 实验材料与评估方法第52页
        4.3.2 模型训练第52-53页
        4.3.3 实验结果与分析第53-57页
    4.4 本章小结第57-58页
第五章 总结与展望第58-60页
    5.1 本文工作总结第58页
    5.2 展望第58-60页
参考文献第60-65页
致谢第65-66页
攻读学位期间取得的研究成果第66页

论文共66页,点击 下载论文
上一篇:基于FPGA的F-OFDM的同步系统的设计与实现
下一篇:复杂表格文档图像的模板识别与提取