首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于热点网站内容分析的超链接提取研究

摘要第1-7页
Abstract第7-11页
1 绪论第11-14页
   ·引言第11-12页
   ·网页信息提取的应用第12-13页
   ·本文主要内容第13-14页
2 网页信息提取技术概述第14-21页
   ·信息提取定义第14-15页
   ·信息提取技术的发展历史和现状第15-16页
   ·网页信息提取的分类第16-18页
     ·网页内容提取第17页
     ·网页结构提取第17-18页
     ·网页日志记录提取第18页
   ·热点网站页面信息提取算法第18-19页
     ·主题网页的信息提取算法第18-19页
     ·Hub网页的信息提取算法第19页
   ·小结第19-21页
3 热点网站页面内容特点分析第21-35页
   ·热点网站及热点网站体育NBA特点第21-24页
     ·热点网站及热点网页定义第21-22页
     ·搜狐体育NBA页面内容组成及分析第22页
     ·手工查询搜狐体育NBA页面源文件第22-24页
   ·搜狐与网易NBA页面特点及比较第24-25页
     ·搜狐体育NBA页面特点第24页
     ·网易体育NBA页面特点第24页
     ·二者页面特点比较第24-25页
   ·从网页语言特点分析热点网站第25-31页
     ·HTML语言简介第25-26页
     ·热点网站HTML标签布局特点第26页
     ·热点网站静态网页的特点第26-27页
     ·热点网站网页超链接标记第27-31页
   ·热点内容分析与内部关系第31-33页
     ·搜狐体育NBA页面热点内容分析第31-32页
     ·搜狐体育NBA页面内部关系第32-33页
   ·热点网站链接特点与页面热度关系第33-34页
   ·小结第34-35页
4 HTML Parser解析热点网页的实现思路第35-49页
   ·主流HTML文档解析器对比分析第35-37页
     ·主流HTML文档解析器介绍第35-36页
     ·常用HTML文档解析器比较第36-37页
   ·选择HTML Parser的理由第37-42页
     ·HTML Parser的部分成果第37-38页
     ·HTML Parser采集热点网页第38-41页
     ·从搜狐体育NBA页面输出源代码看网页特征第41-42页
   ·系统运行环境准备第42-44页
     ·Java环境安装配置第42-43页
     ·HTML Parser安装配置第43-44页
   ·用HTML Parser来分析实现思路第44-46页
     ·热点网站内容分析基本流程第44-45页
     ·热点网站内容分析系统结构第45页
     ·HTML Parser解析网页的实现思路第45-46页
   ·基于HTML Parser的热点双反馈URL及正文提取算法第46-48页
     ·网页预处理第47页
     ·HTML Parser提取URL第47页
     ·URL反馈第47页
     ·HTML Parser提取正文第47页
     ·正文反馈第47-48页
   ·小结第48-49页
5 基于HTML Parser的网页超链接提取实现第49-58页
   ·开发平台及工具第49页
   ·系统结构第49-50页
     ·提取热点网站内部超链接信息算法第49-50页
     ·系统结构第50页
   ·系统实现第50-54页
     ·HTML Parser提取网页超链接第50-52页
     ·HTML Parser提取网页文本信息第52-54页
   ·系统运行结果及有效性评价第54-57页
     ·查询显示提取的结果第54-56页
     ·运行结果的有效性评价第56-57页
   ·小结第57-58页
6 结论与展望第58-59页
参考文献第59-60页
致谢第60-61页
个人简历第61页
发表的学术论文第61页

论文共61页,点击 下载论文
上一篇:基于VRML虚拟购物网站的设计与实现
下一篇:基于球面调和的三维模型检索系统研究与实现