首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于XML的Web信息抽取研究

第1章 绪论第1-12页
   ·选题背景和意义第9-10页
   ·Web信息的抽取第10页
   ·信息抽取与信息检索的区别第10-11页
   ·本文的研究内容第11页
   ·本文的组织第11-12页
第2章 Web信息抽取技术与XML相关标准第12-27页
   ·Web信息抽取技术第12-21页
     ·Web信息抽取技术的分类第12-18页
     ·Web信息抽取存在的问题第18-19页
     ·Web信息抽取的关键技术第19-20页
     ·信息抽取系统的评测指标第20-21页
   ·XML相关标准第21-27页
     ·XML第21-24页
     ·XHTML第24页
     ·DOM第24页
     ·XPath第24-25页
     ·XSLT第25-27页
第3章 基于XML的Web信息抽取系统第27-48页
   ·设计目标与思路第27-31页
     ·系统的目标第27页
     ·设计的基本思路第27-28页
     ·XML和XSLT在系统中的角色第28-30页
     ·数据导向型页面第30-31页
   ·系统的总体框架第31-32页
   ·系统中的知识库与数据库第32-34页
     ·构造领域知识库第32-33页
     ·抽取规则库第33-34页
     ·抽取结果数据库和Web页面数据库第34页
   ·页面优化模块第34-37页
     ·清洗页面文档第34-37页
     ·页面解析第37页
   ·信息抽取模块第37-48页
     ·规则学习的依据第38-40页
     ·规则学习的步骤第40-47页
     ·信息抽取第47-48页
第4章 抽取规则的优化方法研究第48-56页
   ·优化问题的提出第48-49页
   ·改进的定位方法第49-52页
     ·路径与内容结合的方法第49-50页
     ·完全基于文本的方法第50-51页
     ·基于属性的方法第51页
     ·几种方法的比较第51-52页
   ·方法的组合第52-54页
   ·优化后的抽取规则第54-55页
   ·抽取结果的处理第55-56页
第5章 结论第56-57页
攻读学位期间公开发表的论文第57-58页
致谢第58-59页
参考文献第59-63页
附录第63-67页
 部分程序代码第63-67页
研究生履历第67页

论文共67页,点击 下载论文
上一篇:关于中学语文多媒体教学的思考
下一篇:中学语文教学培养学生的创造性思维