首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于搜索引擎的邮箱地址自动提取系统开发

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-17页
   ·课题研究的背景及意义第8-10页
   ·发展历史和研究现状第10-15页
     ·国内研究现状第10-12页
     ·国外研究现状第12-13页
     ·常见的邮箱搜索器第13-15页
   ·本文主要内容第15-16页
   ·论文组织结构第16-17页
第2章 搜索引擎技术和 Web 中 Email 信息提取第17-32页
   ·搜索引擎第17-20页
     ·搜索引擎的基本概念及工作原理第17-18页
     ·搜索引擎的分类第18-19页
     ·搜索引擎 API第19-20页
   ·网页页面的组成第20-24页
     ·Web 网页概述第20-22页
     ·HTML 简介及常用标签的介绍第22-24页
   ·常用的 web 提取算法第24-31页
     ·基于 ontology 方式的信息抽取算法第25-26页
     ·基于包装器归纳方式的信息抽取算法第26页
     ·基于 Web 查询的信息抽取算法第26页
     ·基于 HTMLParser 包的信息抽取算法第26-28页
     ·基于正则表达式的信息抽取算法第28-31页
   ·网页 Email 信息提取的效果评价第31页
   ·本章小结第31-32页
第3章 基于正则表达式和 HTMLParser 的 Web 信息提取算法第32-37页
   ·HTMLParser 的应用第32-34页
     ·HTMLParser 包测试第32-33页
     ·邮箱地址提取系统中 HTMLParser 的应用第33-34页
   ·正则表达式的应用第34-35页
     ·Java 中支持正则表达式的 API第34-35页
     ·邮箱地址提取系统中正则表达式的应用第35页
   ·HTMLParser 和正则表达式的结合第35-36页
   ·本章小结第36-37页
第4章 Email 地址自动提取系统的实现第37-52页
   ·系统结构分析第37页
   ·系统实现的基本思路第37-39页
   ·Email 地址自动提取系统各模块的实现第39-50页
     ·获取搜索引擎结果页面信息第39-41页
     ·网页编码转换第41-42页
     ·网站内部深层 URL 及 Email 地址自动提取第42-47页
     ·避免重复搜索提取的办法第47-48页
     ·按邮箱地址类型的过滤与信息存储第48-50页
   ·本章小结第50-52页
第5章 Email 地址自动提取系统功能及评测第52-64页
   ·界面搭建及开发环境设置第52-56页
     ·基于 eclipse 的邮箱搜索器环境设置第52-55页
     ·系统用户界面搭建第55-56页
   ·系统测试中出现的问题及解决方法第56-57页
   ·改进后的 Email 地址自动提取系统第57-60页
   ·系统相关的有效性评价第60-63页
   ·本章小结第63-64页
第6章 总结与展望第64-66页
   ·结论第64-65页
   ·工作展望第65-66页
参考文献第66-69页
致谢第69-70页
攻读硕士期间发表及录用论文第70页

论文共70页,点击 下载论文
上一篇:《杭州旅游》APP应用交互设计实践
下一篇:虚拟社区信息共享主体特征与消费者购买意愿关系的实证研究