基于统计的多文档关键短语和文摘抽取研究

摘要	第1-5页
Abstract	第5-8页
第一章引言	第8-13页
·课题研究意义	第8-9页
·历史与现状	第9-10页
·研究目标	第10-11页
·本文的工作和论文的组织	第11-13页
第二章关键短语和文摘抽取的相关工作	第13-19页
·定义	第15页
·术语和关键短语抽取	第15-16页
·术语抽取	第15-16页
·关键短语抽取	第16页
·多文档文摘抽取	第16-18页
·基于统计的分析方法	第17页
·基于图的分析方法	第17-18页
·共聚类算法	第18页
·本章小结	第18-19页
第三章短语识别	第19-24页
·识别	第19-20页
·过滤	第20-22页
·频度过滤	第20-21页
·互信息过滤	第21-22页
·C-value 过滤	第22页
·本章小结	第22-24页
第四章多文档关键短语和文摘抽取系统	第24-52页
·S-MMR 关键短语和文摘抽取系统	第24-28页
·S-MMR 系统流程图	第24-25页
·S-MMR 系统模型	第25-26页
·位置/频度特征权重	第26页
·短语和句子权重计算	第26-27页
·关键短语抽取和文摘生成	第27-28页
·G-HITS 关键短语和文摘抽取系统	第28-30页
·G-HITS 关键短语和文摘抽取流程图	第28-29页
·G-HITS 系统模型	第29页
·短语和句子权重计算	第29页
·关键短语抽取和文摘生成	第29-30页
·共聚类关键短语和文摘抽取系统	第30-51页
·预处理和短语识别	第31页
·CoC 系统的算法模型	第31-44页
·关键短语抽取	第44-45页
·文摘生成	第45页
·CoC 系统抽取的例子	第45-51页
·本章小结	第51-52页
第五章实验结果与分析	第52-60页
·实验语料	第52页
·评测方法	第52-53页
·实验结果及分析	第53-59页
·多文档关键短语抽取结果	第53-54页
·与专家文摘和自动文摘的对比	第54-55页
·权重计算方法对结果影响	第55-56页
·识别和不识别短语对结果的影响	第56页
·不同的聚类方法对结果的影响	第56-57页
·相似度阈值的变化对结果的影响	第57-58页
·不同的文摘句选择方法对结果的影响	第58页
·实验结果	第58-59页
·本章小结	第59-60页
第六章总结与展望	第60-62页
·总结	第60-61页
·研究展望	第61-62页
参考文献	第62-68页
攻读学位期间公开发表的论文	第68-69页
致谢	第69-70页