首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于名词短语提取与词条权重分析的话题提取算法研究

摘要第4-5页
ABSTRACT第5页
1 绪论第9-16页
    1.1 研究背景与意义第9-10页
    1.2 国内外研究现状第10-14页
        1.2.1 文本特征的研究现状第10-11页
        1.2.2 话题模型的研究现状第11-14页
    1.3 本文的研究工作和内容安排第14-15页
    1.4 本文的创新点第15-16页
2 概率话题模型综述第16-27页
    2.1 基本概念第16页
    2.2 一元模型与一元混合模型第16-17页
    2.3 概率潜在语义分析第17-19页
    2.4 潜在狄利克雷分配模型第19-22页
    2.5 关联话题模型第22-23页
    2.6 动态话题模型第23-24页
    2.7 实验及结果分析第24-26页
    2.8 本章小结第26-27页
3 引入名词短语的话题提取算法第27-38页
    3.1 名词短语提取的流程第27-28页
    3.2 词性标注第28-30页
        3.2.1 基于规则的词性标注方法第28-29页
        3.2.2 基于转换的错误驱动学习方法第29页
        3.2.3 基于统计的词性标注方法第29-30页
        3.2.4 基于规则和统计相结合的词性标注方法第30页
    3.3 句子语法结构分析第30-32页
        3.3.1 基于上下文无关文法(CFG)规则的分析方法第30-31页
        3.3.2 基于概率上下文无关文法(FCFG)规则的分析方法第31-32页
    3.4 实验及结果分析第32-36页
        3.4.1 实验设计第33-34页
        3.4.2 实验结果及分析第34-36页
    3.5 本章小结第36-38页
4 基于词条权重的话题提取算法第38-49页
    4.1 基于评估函数的词条权重计算方法第38-40页
    4.2 基于语义网络的词条权重计算方法第40-45页
        4.2.1 基于网络连通性和聚集性的词条权重计算方法第41-43页
        4.2.2 基于概率转移的权重计算方法第43-45页
    4.3 实验结果及分析第45-47页
    4.4 本章小结第47-49页
5 实验及结果分析第49-60页
    5.1 实验语料库第49页
    5.2 实验设计第49-50页
    5.3 实验结果及分析第50-54页
        5.3.1 话题呈现第50-51页
        5.3.2 话题模型性能分析第51-54页
    5.4 话题强度计算第54-59页
        5.4.1 基于话题支持文档数量进行话题强度计算第55-57页
        5.4.2 基于语料库中话题概率的话题强度计算第57-58页
        5.4.3 基于文本话题显著性的话题强度计算第58-59页
    5.5 本章小结第59-60页
6 总结与展望第60-62页
    6.1 论文工作总结第60页
    6.2 未来工作展望第60-62页
参考文献第62-65页
攻读学位期间的研究成果第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:超大规模、低时延交换机设计
下一篇:基于模糊局部信息的太赫兹图像目标检测