首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于Web信息的内容及其特征提取方法的研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-15页
   ·研究背景和意义第9-10页
   ·国内外现状研究第10-13页
   ·问题综述第13页
   ·本文的研究内容第13-14页
   ·本章小结第14-15页
第二章 相关技术及理论第15-31页
   ·作者身份鉴别的一般方法第15页
   ·Web 信息的种类第15-17页
   ·Web 页面知识第17-20页
     ·HTML 介绍第17-18页
     ·HTML 基本结构第18-19页
     ·文档对象模型(DOM)第19-20页
   ·电子邮件基本知识第20-24页
     ·电子邮件工作原理第20-21页
     ·电子邮件的格式第21-23页
     ·电子邮件的结构第23-24页
   ·文本挖掘与文本分类关键技术第24-30页
     ·Web 文本挖掘第24-25页
     ·文本分类关键技术第25-30页
   ·本章小结第30-31页
第三章 Web 信息的内容提取技术研究第31-54页
   ·研究的主要任务第31-32页
   ·BBS 页面的内容提取第32-38页
     ·页面的规整化第33页
     ·页面内容的结构表示第33-34页
     ·页面主题内容的提取方法第34-37页
     ·主题相关信息的提取第37-38页
   ·中文电子邮件的内容提取第38-42页
     ·首部信息的提取第38页
     ·主体内容的提取第38-41页
     ·内容解码第41-42页
     ·内容提取流程第42页
   ·Web 信息内容提取实验第42-52页
     ·实验目的及环境第42-43页
     ·BBS 页面的内容提取实验第43-47页
     ·中文电子邮件的内容提取实验第47-52页
     ·实验结论第52页
   ·本章小结第52-54页
第四章 Web 信息特征分析与提取方法研究第54-75页
   ·Web 信息的特点概述第54-55页
   ·Web 信息的特征分析第55-60页
     ·语言特征分析第56-58页
     ·非语言特征分析第58-60页
   ·特征提取方法分析第60-62页
     ·语言特征的提取方法第60-62页
     ·非语言特征的提取方法第62页
   ·潜在特征词提取方法研究第62-69页
     ·潜在特征词概述第62-63页
     ·关联规则的概念第63-64页
     ·基于关联规则分析的潜在特征词提取方法第64-69页
   ·特征表达与利用方法研究第69-72页
     ·特征的描述方法第69页
     ·特征的表达方法第69-70页
     ·特征权重第70-71页
     ·特征选择第71-72页
   ·Web 信息的特征提取实验第72-74页
     ·实验目的及环境第72页
     ·特征提取实验第72-74页
     ·实验结论第74页
   ·本章小结第74-75页
第五章 总结与展望第75-76页
致谢第76-77页
参考文献第77-82页
攻硕期间取得的研究成果第82-83页

论文共83页,点击 下载论文
上一篇:多代理技术Web Services的研究与实现
下一篇:校园一卡通系统设计与实现