首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于DOM节点文本密度的网页核心块抽取算法研究

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-14页
   ·研究背景第9-11页
   ·研究现状第11-12页
   ·本文工作第12-13页
   ·论文组织结构第13-14页
第2章 网页核心内容抽取第14-23页
   ·网页核心内容抽取算法介绍第14-20页
     ·基于机器学习第14-15页
     ·基于视觉信息第15-17页
     ·模板检测第17-18页
     ·基于统计规律第18-20页
     ·其他方法第20页
   ·网页核心内容抽取应用第20-23页
     ·Web as Corpus第20-21页
     ·在小屏幕设备上的应用第21页
     ·其他应用第21-23页
第3章 Text Density第23-32页
   ·DOM第24-25页
   ·Elementary Text Density第25-28页
   ·Composite Text Density第28-29页
   ·关于Text Density 的一般性定义的思考第29-32页
     ·Text Density 的定义第29-30页
     ·Text Density 的另一种变形第30-32页
第4章 抽取算法第32-37页
   ·阈值第32-33页
   ·DensitySum第33-37页
第5章 实验第37-49页
   ·算法实现第37-39页
     ·HTML 代码清理第37-38页
     ·HTML 代码解析第38-39页
     ·算法实现细节第39页
   ·测试数据集第39-40页
   ·评价标准第40-41页
     ·标准指标第40页
     ·Score第40-41页
   ·对比算法第41页
   ·实验结果第41-44页
   ·算法结果比较第44-47页
   ·结果讨论第47-49页
结论第49-50页
展望第50-51页
参考文献第51-55页
攻读学位期间发表论文与研究成果清单第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:三维流场流线放置方法研究
下一篇:基于内容的大规模数字图像检索技术研究