Web信息抽取与网页摘要的研究与应用

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-15页
·问题的提出及意义	第8-9页
·国内外研究现状与技术分析	第9-12页
·信息抽取主要技术工具的比较分析	第9-10页
·中文单文档摘要技术的比较分析	第10-12页
·课题的研究意义	第12-13页
·抽取方法比较分析	第12页
·网页摘要技术的新特点	第12-13页
·本文研究的提出	第13页
·本文的工作	第13-14页
·论文的组织	第14-15页
2 相关技术	第15-26页
·信息抽取研究	第15-19页
·信息抽取发展历史	第15-16页
·Web信息抽取技术	第16-19页
·网页摘要研究	第19-26页
·自动摘要发展历史	第19-20页
·自动摘要技术	第20-26页
3 网页正文信息的抽取	第26-43页
·Web信息抽取	第26-27页
·相关技术规范	第27-32页
·HTML规范	第27-28页
·XML规范	第28-30页
·DOM规范	第30-32页
·Web信息抽取方法	第32-35页
·基于节点频度和语义距离的抽取方法	第35-40页
·方法的主要思想	第35-36页
·确定主题区域	第36页
·构建 BF-DOM树	第36-38页
·网页标题抽取	第38页
·正文信息抽取	第38-40页
·实验与分析	第40-43页
·信息抽取的评价标准	第40-41页
·实验结果	第41-42页
·结果分析	第42-43页
4 网页文本的自动摘要	第43-60页
·摘要系统的模型	第43-44页
·统计模型方法	第43页
·系统体系结构	第43-44页
·摘要系统实现	第44-49页
·特征词的选取	第44页
·语句的选择	第44-45页
·篇章结构的分析	第45页
·摘要结果的后期加工	第45-46页
·多文本摘要	第46-49页
·基于段落结构和特征分析的自动摘要	第49-54页
·段落结构分析	第49-51页
·关键词提取	第51-52页
·摘要生成	第52-54页
·实验与分析	第54-60页
·自动摘要的评价标准	第54页
·实验结果	第54-56页
·与 MS Office自动摘要功能的比较	第56-57页
·结果分析及应用	第57-60页
结论	第60-61页
参考文献	第61-63页
攻读硕士学位期间发表学术论文情况	第63-64页
致谢	第64-65页