专题式Web信息获取技术研究

摘要	第1-4页
ABSTRACT	第4-8页
符号说明	第8-9页
第一章绪论	第9-10页
第二章 Web信息获取概述	第10-20页
·Web信息获取的历史	第10-11页
·搜索引擎概述	第11-12页
·搜索引擎的功能结构	第12-14页
·Web信息获取的类型	第14-15页
·分类目录	第14-15页
·机器人收集(Spider)	第15页
·元搜索	第15页
·Spider的类型	第15-18页
·基于整个Web的信息获取	第15-16页
·专题式Web信息获取	第16-17页
·移动式信息获取	第17页
·基于用户个性化的Web信息获取	第17-18页
·基于Agent的信息获取	第18页
·Web信息获取现状及发展	第18-20页
第三章专题式Web信息获取技术及理论分析	第20-33页
·Web信息获取原理	第20页
·网络信息结构	第20-24页
·互联网结构	第20-21页
·网页结构	第21-22页
·Meta标签结构	第22-23页
·robots. txt文件规范	第23-24页
·专题Web信息在网络上的分布情况	第24-25页
·网页质量评估算法	第25-29页
·基于链接结构的评估算法	第25-27页
·基于内容相似度的评估算法	第27-29页
·Spider的搜索算法	第29-30页
·分布式Spider	第30-31页
·自动分类技术	第31-33页
第四章专题Web信息获取系统设计及实现	第33-50页
·系统设计思路及目标	第33-34页
·SQL数据库表格设计	第34-35页
·种子获取器	第35-36页
·工作原理	第35-36页
·试验结果	第36页
·网页下载器	第36-43页
·页面下载及解析流程	第36-39页
·URL的存取	第39-42页
·网址过滤器	第42页
·文件保存	第42-43页
·系统中用到的主要Java技术	第43-48页
·数据库访问	第44-46页
·多线程技术	第46页
·XML文件导出	第46-47页
·设计模式	第47-48页
·进一步的研究工作	第48-50页
第五章总结	第50-51页
参考文献	第51-54页
附录1	第54-56页
致谢	第56-57页
攻读学位期间发表的学术论文目录	第57页