首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向普适计算的正文抽取技术的研究与设计

摘要第1-5页
Abstract第5-9页
第一章 引言第9-15页
   ·课题来源第9页
   ·选题背景和意义第9-11页
   ·国内外相关研究工作第11-12页
   ·研究内容和组织结构第12-15页
     ·研究内容第12-13页
     ·论文结构第13-15页
第二章 正文抽取技术第15-24页
   ·正文抽取的难点与目标第15-16页
   ·正文的界定第16-18页
   ·现有正文抽取方法第18-22页
     ·基于模板的抽取方法第18-20页
     ·基于视觉特征的抽取方法第20页
     ·基于本体论的抽取方法第20-21页
     ·基于统计的抽取方法第21-22页
   ·现有方法综合评价第22-23页
   ·WEB 正文抽取技术的发展方向第23-24页
第三章 SCF 方法的研究第24-34页
   ·算法总体思想第24-26页
   ·构造网页 DOM 树第26页
   ·挖掘正文区域及子树主干第26-31页
     ·获取正文路径第27-30页
     ·挖掘正文区域及子树主干第30-31页
   ·获取相对正文子树算法第31-33页
   ·剪枝及抽取方法第33-34页
第四章 系统实现第34-46页
   ·设计目标第34-35页
   ·系统总体框架第35-37页
   ·页面优化处理第37-40页
     ·规范HTML 文档第37-38页
     ·文档对象模型第38-40页
   ·规则学习第40-42页
   ·抽取第42-46页
     ·抽取正文第42-43页
     ·存储第43-46页
第五章 实验与验证第46-54页
   ·系统环境第46-47页
   ·试验环境验证第47-50页
   ·实验结果与分析第50-53页
   ·小结第53-54页
第六章 总结与展望第54-56页
   ·本文的工作总结第54页
   ·下一步工作展望第54-56页
参考文献第56-59页
致谢第59-60页
附录 A(攻读硕士学位期间参与的科研项目和研究成果)第60页

论文共60页,点击 下载论文
上一篇:高校图书馆网络免费学术资源建设研究
下一篇:基于mts-pca的特征选择方法研究及其在肿瘤分类中的应用