基于搜索引擎和XML的化工物性搜集与发布系统的开发
摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
符号说明 | 第8-9页 |
第一章 绪论 | 第9-10页 |
第二章 搜索引擎概述 | 第10-17页 |
·搜索引擎发展概述 | 第10-12页 |
·搜索引擎工作原理 | 第12页 |
·第三代搜索引擎 | 第12-15页 |
·专业领域数据库搜索引擎 | 第15页 |
·搜索引擎面临的技术挑战 | 第15-17页 |
第三章 系统中用到的主要技术 | 第17-27页 |
·JDBC | 第17-19页 |
·XML与Schema | 第19-20页 |
·Java Web服务 | 第20-23页 |
·XML和XSD | 第21页 |
·SOAP | 第21页 |
·WSDL | 第21-22页 |
·UDDl | 第22页 |
·远程过程调用RPC与消息传递 | 第22-23页 |
·设计模式 | 第23-27页 |
第四章 页面分析和信息提取概述 | 第27-33页 |
·WWW信息结构 | 第27-29页 |
·URL结构 | 第27页 |
·网页结构 | 第27-29页 |
·页面分析技术 | 第29-31页 |
·页面结构对比分析 | 第30-31页 |
·页面内容对比分析 | 第31页 |
·主动式Web信息获取 | 第31-33页 |
第五章 数据搜集与发布系统设计及实现 | 第33-45页 |
·系统设计 | 第33-36页 |
·SQL数据库表格设计 | 第36-37页 |
·站点基本信息表 | 第36页 |
·数据详细页面地址表 | 第36页 |
·物性数据表 | 第36-37页 |
·自动登录器 | 第37页 |
·列表获取器 | 第37-38页 |
·列表页面分析器 | 第37-38页 |
·详细页面地址保存器 | 第38页 |
·详细页面分析器 | 第38-40页 |
·详细页面获取器 | 第38-39页 |
·初始数据结构分析器 | 第39页 |
·数据获取器 | 第39-40页 |
·数据处理器 | 第40-42页 |
·数据库配置器 | 第40-41页 |
·表生成器 | 第41-42页 |
·数据更新器 | 第42页 |
·数据提取优化 | 第42-45页 |
·数据字典种子 | 第43-44页 |
·化工物性数据种子 | 第44-45页 |
第六章 总结 | 第45-47页 |
·已完成工作 | 第45页 |
·本系统有待研究的内容 | 第45-47页 |
参考文献 | 第47-50页 |
附录1 列表获取器源程序 | 第50-52页 |
附录2 数据获取器源程序 | 第52-57页 |
致谢 | 第57-58页 |
攻读学位期间发表的学术论文目录 | 第58页 |