首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

模板化Web文档的主题信息自动抽取方法研究

中文摘要第1-6页
Abstract第6-10页
第一章 绪论第10-17页
   ·论文的研究背景及意义第10-12页
   ·国内外研究现状第12-14页
   ·论文的研究内容及创新之处第14-15页
   ·论文的组织结构第15-17页
第二章 相关技术和方法第17-24页
   ·DOM介绍第17-19页
     ·DOM定义第17-18页
     ·DOM常用方法第18-19页
   ·HTMLParser解析器第19-20页
   ·模板化Web文档结构分析第20-23页
   ·小结第23-24页
第三章 模板化文档的主题信息自动抽取方法设计第24-51页
   ·主题信息自动抽取系统的框架第24-28页
   ·Web文档预处理第28-31页
     ·基本定义第28-29页
     ·主题无关结点过滤第29-31页
     ·无效结点过滤第31页
   ·动态区域块的定位阶段第31-38页
     ·DOM树匹配算法第32-36页
     ·动态区域块的定位算法第36-38页
   ·非主题链接块的过滤第38-43页
     ·重复区域的定位第38-42页
     ·非主题链接块的过滤第42-43页
   ·主题数据的精确定位第43-50页
     ·启发式规则定义第43-45页
     ·初始化权值矩阵第45-46页
     ·基于启发式规则的精确定位第46-47页
     ·阈值选取及权值训练第47-50页
   ·小结第50-51页
第四章 实验结果及分析第51-62页
   ·系统原型第51-54页
   ·实验结果及分析第54-61页
     ·长度阈值估计方法的检验第55-56页
     ·信息抽取系统评价第56-61页
   ·小结第61-62页
第五章 总结和展望第62-64页
   ·全文总结第62-63页
   ·进一步的研究工作第63-64页
参考文献第64-67页
在校期间参加的科研项目和发表的论文第67-68页
附件第68-70页
致谢第70-71页

论文共71页,点击 下载论文
上一篇:基于复杂网络的研究性学习群体学习关系分析
下一篇:面向语义信息检索的模糊本体自动化构建的研究