基于搜索引擎的邮箱地址自动提取系统开发

摘要	第1-5页
Abstract	第5-8页
第1章绪论	第8-17页
·课题研究的背景及意义	第8-10页
·发展历史和研究现状	第10-15页
·国内研究现状	第10-12页
·国外研究现状	第12-13页
·常见的邮箱搜索器	第13-15页
·本文主要内容	第15-16页
·论文组织结构	第16-17页
第2章搜索引擎技术和 Web 中 Email 信息提取	第17-32页
·搜索引擎	第17-20页
·搜索引擎的基本概念及工作原理	第17-18页
·搜索引擎的分类	第18-19页
·搜索引擎 API	第19-20页
·网页页面的组成	第20-24页
·Web 网页概述	第20-22页
·HTML 简介及常用标签的介绍	第22-24页
·常用的 web 提取算法	第24-31页
·基于 ontology 方式的信息抽取算法	第25-26页
·基于包装器归纳方式的信息抽取算法	第26页
·基于 Web 查询的信息抽取算法	第26页
·基于 HTMLParser 包的信息抽取算法	第26-28页
·基于正则表达式的信息抽取算法	第28-31页
·网页 Email 信息提取的效果评价	第31页
·本章小结	第31-32页
第3章基于正则表达式和 HTMLParser 的 Web 信息提取算法	第32-37页
·HTMLParser 的应用	第32-34页
·HTMLParser 包测试	第32-33页
·邮箱地址提取系统中 HTMLParser 的应用	第33-34页
·正则表达式的应用	第34-35页
·Java 中支持正则表达式的 API	第34-35页
·邮箱地址提取系统中正则表达式的应用	第35页
·HTMLParser 和正则表达式的结合	第35-36页
·本章小结	第36-37页
第4章 Email 地址自动提取系统的实现	第37-52页
·系统结构分析	第37页
·系统实现的基本思路	第37-39页
·Email 地址自动提取系统各模块的实现	第39-50页
·获取搜索引擎结果页面信息	第39-41页
·网页编码转换	第41-42页
·网站内部深层 URL 及 Email 地址自动提取	第42-47页
·避免重复搜索提取的办法	第47-48页
·按邮箱地址类型的过滤与信息存储	第48-50页
·本章小结	第50-52页
第5章 Email 地址自动提取系统功能及评测	第52-64页
·界面搭建及开发环境设置	第52-56页
·基于 eclipse 的邮箱搜索器环境设置	第52-55页
·系统用户界面搭建	第55-56页
·系统测试中出现的问题及解决方法	第56-57页
·改进后的 Email 地址自动提取系统	第57-60页
·系统相关的有效性评价	第60-63页
·本章小结	第63-64页
第6章总结与展望	第64-66页
·结论	第64-65页
·工作展望	第65-66页
参考文献	第66-69页
致谢	第69-70页
攻读硕士期间发表及录用论文	第70页