首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于分块的主题信息抽取研究与应用

摘要第1-5页
Abstract第5-8页
1 绪论第8-12页
   ·研究背景第8-9页
   ·国内外研究现状第9-10页
   ·本文的主要工作和组织第10-12页
2 网络蜘蛛和网页信息提取技术第12-23页
   ·网络蜘蛛技术第12-17页
     ·网络蜘蛛的工作原理第12-14页
     ·网页搜索策略第14页
     ·网页搜集第14-16页
     ·网页处理第16-17页
   ·网页主题信息抽取第17-23页
     ·HTML和DOM简介第17-19页
     ·信息抽取概述第19-20页
     ·信息抽取目标第20-23页
3 网页主题链接提取方法研究第23-34页
   ·自定义主题第23-26页
     ·自定义主题简介第23-24页
     ·主题确定方法第24-26页
   ·主题块内的链接第26-28页
   ·主题相关链接的提取方法研究第28-34页
     ·链接锚文本与链接上下文简介第28-29页
     ·链接上下文描述文档第29-30页
     ·链接上下文提取算法第30-31页
     ·主题链接提取方法研究第31-34页
4 网页主题信息抽取算法的研究第34-44页
   ·网页主题信息抽取的目标第34-36页
   ·网页正文内容块提取算法研究第36-38页
     ·网页正文标题提取第37-38页
     ·网页正文内容块提取第38页
   ·网页正文内容提取第38-42页
     ·内容块的块特征第39页
     ·标点符号序列第39页
     ·冗余HTML标签的清除第39-42页
   ·实验结果对比第42-44页
5 主题信息抽取系统应用第44-55页
   ·网页布局研究第44页
   ·刑侦网页主题信息抽取第44-46页
     ·网页HTML标签文档清洗第45页
     ·网页正文标题的提取第45-46页
     ·网页正文信息抽取第46页
   ·刑侦网页主题信息抽取结果第46-50页
     ·主题链接抽取结果第46-48页
     ·主题信息抽取结果第48-50页
   ·信息抽取系统介绍第50-53页
     ·系统模块介绍第51-52页
     ·系统功能介绍第52-53页
   ·系统实验结果第53-55页
结论第55-56页
参考文献第56-59页
攻读硕士学位期间发表学术论文情况第59-60页
致谢第60-61页

论文共61页,点击 下载论文
上一篇:基于事务的Web服务组合问题的研究与应用
下一篇:基于PKI/PMI的改进DRBAC模型的研究与应用