首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于区域定位的购物网站商品信息抽取方法

摘要第1-6页
Abstract第6-10页
插图索引第10-11页
附表索引第11-12页
第1章 绪论第12-18页
   ·选题背景和意义第12-13页
   ·Web 信息抽取研究现状第13-16页
   ·本文主要工作第16页
   ·本文组织结构第16-17页
   ·本章小结第17-18页
第2章 Web 信息抽取的相关知识介绍第18-29页
   ·SGML 简介第18页
   ·Web 页面的分析第18-21页
     ·HTML 简介第18-19页
     ·HTML 语言结构分析第19-20页
     ·HTML 页面的特点第20-21页
   ·Web 信息抽取的概念第21-22页
   ·Web 信息抽取技术分类第22-26页
     ·基于自然语言处理方式的信息抽取第23页
     ·基于包装器归纳方式的信息抽取第23-25页
     ·基于ontology 方式的信息抽取第25-26页
     ·基于HTML 结构的信息抽取第26页
     ·基于Web 查询的信息抽取第26页
   ·Web 信息抽取的难点第26-27页
   ·Web 信息抽取技术的评价指标第27-28页
   ·本章小结第28-29页
第3章 基于区域定位的购物网站信息抽取算法设计第29-35页
   ·基本设计思想第29页
   ·购物网站页面结构分析第29-30页
   ·关键技术第30-34页
     ·准核心区域定位算法第30-32页
     ·核心区域定位算法第32-33页
     ·信息抽取算法第33-34页
   ·本章小结第34-35页
第4章 系统设计第35-53页
   ·系统功能、框架和流程第35-37页
     ·系统功能第35页
     ·系统框架第35-36页
     ·系统流程第36-37页
   ·页面预处理第37-44页
     ·相关知识第37-38页
     ·HTML 标记修复第38-40页
     ·噪声处理第40-44页
   ·区域定位第44-48页
   ·核心区域结构分析第48-52页
   ·本章小结第52-53页
第5章 系统实现第53-61页
   ·系统开发工具与运行环境第53-55页
     ·Java 语言第53页
     ·所利用的成熟技术第53-54页
     ·开发工具和运行环境第54-55页
   ·包和类结构第55-56页
     ·包结构第55页
     ·webshop.main 中的类结构第55-56页
   ·软件功能和界面介绍第56-58页
   ·实验和分析第58-60页
   ·本章小结第60-61页
总结与展望第61-63页
参考文献第63-67页
致谢第67-68页
附录 A 攻读学位期间完成的论文第68页

论文共68页,点击 下载论文
上一篇:基于免疫神经网络和漏桶算法的入侵检测系统研究
下一篇:基于T/TCP协议构建无线嵌入式WEB服务器