基于名词短语提取与词条权重分析的话题提取算法研究

摘要	第4-5页
ABSTRACT	第5页
1 绪论	第9-16页
1.1 研究背景与意义	第9-10页
1.2 国内外研究现状	第10-14页
1.2.1 文本特征的研究现状	第10-11页
1.2.2 话题模型的研究现状	第11-14页
1.3 本文的研究工作和内容安排	第14-15页
1.4 本文的创新点	第15-16页
2 概率话题模型综述	第16-27页
2.1 基本概念	第16页
2.2 一元模型与一元混合模型	第16-17页
2.3 概率潜在语义分析	第17-19页
2.4 潜在狄利克雷分配模型	第19-22页
2.5 关联话题模型	第22-23页
2.6 动态话题模型	第23-24页
2.7 实验及结果分析	第24-26页
2.8 本章小结	第26-27页
3 引入名词短语的话题提取算法	第27-38页
3.1 名词短语提取的流程	第27-28页
3.2 词性标注	第28-30页
3.2.1 基于规则的词性标注方法	第28-29页
3.2.2 基于转换的错误驱动学习方法	第29页
3.2.3 基于统计的词性标注方法	第29-30页
3.2.4 基于规则和统计相结合的词性标注方法	第30页
3.3 句子语法结构分析	第30-32页
3.3.1 基于上下文无关文法(CFG)规则的分析方法	第30-31页
3.3.2 基于概率上下文无关文法(FCFG)规则的分析方法	第31-32页
3.4 实验及结果分析	第32-36页
3.4.1 实验设计	第33-34页
3.4.2 实验结果及分析	第34-36页
3.5 本章小结	第36-38页
4 基于词条权重的话题提取算法	第38-49页
4.1 基于评估函数的词条权重计算方法	第38-40页
4.2 基于语义网络的词条权重计算方法	第40-45页
4.2.1 基于网络连通性和聚集性的词条权重计算方法	第41-43页
4.2.2 基于概率转移的权重计算方法	第43-45页
4.3 实验结果及分析	第45-47页
4.4 本章小结	第47-49页
5 实验及结果分析	第49-60页
5.1 实验语料库	第49页
5.2 实验设计	第49-50页
5.3 实验结果及分析	第50-54页
5.3.1 话题呈现	第50-51页
5.3.2 话题模型性能分析	第51-54页
5.4 话题强度计算	第54-59页
5.4.1 基于话题支持文档数量进行话题强度计算	第55-57页
5.4.2 基于语料库中话题概率的话题强度计算	第57-58页
5.4.3 基于文本话题显著性的话题强度计算	第58-59页
5.5 本章小结	第59-60页
6 总结与展望	第60-62页
6.1 论文工作总结	第60页
6.2 未来工作展望	第60-62页
参考文献	第62-65页
攻读学位期间的研究成果	第65-66页
致谢	第66页