首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

自定义主题信息抽取的研究与应用

摘要第1-5页
Abstract第5-8页
1 绪论第8-11页
   ·课题研究背景第8-9页
   ·国内外研究现状第9-10页
   ·本文的主要工作和组织第10-11页
2 Web数据的自动采集技术第11-22页
   ·网络机器人技术第11-16页
     ·工作原理第11-12页
     ·设计原则第12-14页
     ·深度、广度优先搜索第14页
     ·网络陷阱第14-15页
     ·均衡访问第15-16页
     ·超链接提取相关实现第16页
   ·网页数据提取技术第16-22页
     ·HTML概述第17页
     ·网页的结构分析第17-18页
     ·网页控制符分析第18-19页
     ·网页纯文本的提取第19-22页
3 网页主题确定的方法研究第22-30页
   ·自定义主题第22-24页
     ·自定义主题概述第22-23页
     ·自定义主题的确定第23-24页
   ·网页主题区域的链接第24-25页
   ·主题链接的获取第25-30页
     ·链接锚文本与链接上下文简介第25-26页
     ·链接锚文本文档与链接上下文文档第26-27页
     ·链接上下文提取算法第27页
     ·局部扩散提取链接方法的研究第27-30页
4 网页主题信息抽取算法的研究第30-42页
   ·主题信息抽取目标第31-32页
   ·主题信息抽取算法应用研究第32-33页
   ·网页文本语义获取的方法研究第33-41页
     ·基于布局标签的粗粒度划分第34-38页
     ·网页文本语义获取方法研究第38-41页
   ·基于分块的网页主题信息抽取流程第41-42页
5 主题化信息抽取在刑侦网中的应用第42-54页
   ·网页特征分析第42-43页
   ·刑侦网页主题信息抽取算法的实现第43-49页
     ·语义块和网页类型判别方法第43-45页
     ·基于网页量化的主题信息抽取第45-46页
     ·实验结果比较第46-48页
     ·刑侦网页主题信息抽取结果第48-49页
   ·自定义主题信息抽取系统的设计第49-54页
     ·系统两大功能第50-51页
     ·系统三大模块第51-52页
     ·系统实验结果第52-54页
结论第54-55页
参考文献第55-57页
攻读硕士学位期间发表学术论文情况第57-58页
致谢第58-59页

论文共59页,点击 下载论文
上一篇:胡瑗易学思想研究
下一篇:快速程序流分析方法的研究与应用