基于Web信息的内容及其特征提取方法的研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-15页
·研究背景和意义	第9-10页
·国内外现状研究	第10-13页
·问题综述	第13页
·本文的研究内容	第13-14页
·本章小结	第14-15页
第二章相关技术及理论	第15-31页
·作者身份鉴别的一般方法	第15页
·Web 信息的种类	第15-17页
·Web 页面知识	第17-20页
·HTML 介绍	第17-18页
·HTML 基本结构	第18-19页
·文档对象模型(DOM)	第19-20页
·电子邮件基本知识	第20-24页
·电子邮件工作原理	第20-21页
·电子邮件的格式	第21-23页
·电子邮件的结构	第23-24页
·文本挖掘与文本分类关键技术	第24-30页
·Web 文本挖掘	第24-25页
·文本分类关键技术	第25-30页
·本章小结	第30-31页
第三章 Web 信息的内容提取技术研究	第31-54页
·研究的主要任务	第31-32页
·BBS 页面的内容提取	第32-38页
·页面的规整化	第33页
·页面内容的结构表示	第33-34页
·页面主题内容的提取方法	第34-37页
·主题相关信息的提取	第37-38页
·中文电子邮件的内容提取	第38-42页
·首部信息的提取	第38页
·主体内容的提取	第38-41页
·内容解码	第41-42页
·内容提取流程	第42页
·Web 信息内容提取实验	第42-52页
·实验目的及环境	第42-43页
·BBS 页面的内容提取实验	第43-47页
·中文电子邮件的内容提取实验	第47-52页
·实验结论	第52页
·本章小结	第52-54页
第四章 Web 信息特征分析与提取方法研究	第54-75页
·Web 信息的特点概述	第54-55页
·Web 信息的特征分析	第55-60页
·语言特征分析	第56-58页
·非语言特征分析	第58-60页
·特征提取方法分析	第60-62页
·语言特征的提取方法	第60-62页
·非语言特征的提取方法	第62页
·潜在特征词提取方法研究	第62-69页
·潜在特征词概述	第62-63页
·关联规则的概念	第63-64页
·基于关联规则分析的潜在特征词提取方法	第64-69页
·特征表达与利用方法研究	第69-72页
·特征的描述方法	第69页
·特征的表达方法	第69-70页
·特征权重	第70-71页
·特征选择	第71-72页
·Web 信息的特征提取实验	第72-74页
·实验目的及环境	第72页
·特征提取实验	第72-74页
·实验结论	第74页
·本章小结	第74-75页
第五章总结与展望	第75-76页
致谢	第76-77页
参考文献	第77-82页
攻硕期间取得的研究成果	第82-83页