首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息内容及其特征提取方法研究

摘要第1-6页
Abstract第6-10页
1 引言第10-16页
   ·研究背景和意义第10-11页
   ·国内外研究现状第11-14页
     ·Web信息内容提取研究第11-12页
     ·文本分类和Web文本分类第12页
     ·作品特征提取研究第12-13页
     ·Web信息发布源同一认定研究第13-14页
   ·问题综述第14-15页
   ·本文的研究内容第15-16页
2 相关理论及技术第16-28页
   ·Web信息的分类第16-17页
   ·Web页面基本知识第17-18页
     ·HTML简介第17页
     ·HTML基本结构第17-18页
     ·文档对象模型(DOM)第18页
   ·电子邮件基本知识第18-21页
     ·电子邮件工作原理第18-19页
     ·电子邮件的格式第19-21页
   ·文本分类关键技术第21-27页
     ·文本分词第21-22页
     ·特征表示(向量空间模型)第22页
     ·特征权重第22-23页
     ·特征选择第23-27页
   ·本章小结第27-28页
3 Web信息内容提取技术研究第28-37页
   ·Web信息内容提取的任务第28页
   ·HTML页面内容提取第28-32页
     ·HTML文件的规整化第29页
     ·HTML网页内容结构表示第29-30页
     ·HTML页面主题内容块提取技术第30-32页
     ·相关主题信息提取第32页
   ·电子邮件内容提取第32-36页
     ·邮件头信息提取第33页
     ·邮件信体内容提取第33-34页
     ·邮件内容解码第34-35页
     ·电子邮件内容提取流程第35-36页
   ·本章小结第36-37页
4 Web信息特征分析与提取方法研究第37-50页
   ·Web信息的一般特点第37-38页
   ·Web信息特征分析第38-41页
     ·语言特征第38-40页
     ·非语言特征第40-41页
   ·各类特征的提取方法第41-43页
     ·语言特征的提取方法第41-42页
     ·非语言特征的提取方法第42-43页
   ·基于关联规则分析的潜在特征词提取方法第43-46页
     ·潜在特征词概述第43页
     ·关联规则的基本概念第43-44页
     ·基于关联规则分析的潜在特征词提取方法第44-46页
   ·特征表达与利用方法研究第46-49页
     ·特征的描述方法第46-47页
     ·特征的表达方法第47页
     ·特征权重第47-49页
     ·特征选择第49页
   ·本章小结第49-50页
5 实验第50-59页
   ·实验目的及实验环境第50页
   ·Web信息内容提取实验第50-56页
     ·HTML页面内容提取实验第50-53页
     ·电子邮件内容提取实验第53-56页
   ·Web信息特征提取实验第56-58页
   ·本章小结第58-59页
6 总结与展望第59-60页
参考文献第60-65页
在读期间发表的学术论文第65-67页
作者简历第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:应用siRNA敲低MMP-9基因表达后对人U251胶质瘤细胞增殖和侵袭作用的体内外研究
下一篇:科学技术与二战后局部战争的关系及历史启示