Web文本自动文摘的研究

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-12页
·问题的提出	第8-9页
·课题研究的理论意义和应用价值	第9-10页
·论文结构与章节安排	第10-12页
2 相关研究综述	第12-23页
·Web正文信息抽取技术的综述	第12-15页
·基于包装器的方法	第12-13页
·基于页面结构树的方法	第13-14页
·基于网页源码特征的方法	第14-15页
·文本主题结构分析	第15-17页
·文本主题结构分析概述	第15页
·文本主题结构分析国内外研究现状	第15-17页
·自动文摘技术综述	第17-23页
·自动文摘基本概念及分类	第17-19页
·自动文摘国内外研究现状	第19-21页
·自动文摘评价方法	第21-23页
3 Web正文信息抽取	第23-31页
·Web页面分析	第23-24页
·预处理-去噪	第24-25页
·确定正文信息块	第25-29页
·处理步骤	第26-27页
·计算节点信息量	第27-28页
·识别分块节点	第28-29页
·块内噪音识别	第29-31页
4 文摘句的获取	第31-42页
·文本相似度的计算	第31-32页
·句子相似度的计算	第31-32页
·段落相似度的计算	第32页
·文本主题结构分析	第32-34页
·基于页面结构的主题划分	第32-33页
·基于段落语义距离的主题划分	第33-34页
·文摘句抽取	第34-42页
·文本关系图的建立	第35-36页
·句子重要度计算	第36-38页
·文摘句抽取	第38-42页
5 Web文摘生成与实验分析	第42-49页
·Web文摘生成系统	第42-45页
·系统处理流程	第42-43页
·文摘生成	第43-45页
·实验结果及分析	第45-49页
·Web正文抽取的实验结果及分析	第45-46页
·文摘抽取的实验结果及分析	第46-49页
结论	第49-51页
参考文献	第51-55页
攻读硕士学位期间发表学术论文情况	第55-56页
致谢	第56-57页