首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息提取技术在企业竞争情报平台的应用研究

摘要第1-5页
ABSTRACT第5-13页
第一章 引言第13-18页
   ·论文选题及研究意义第13-14页
   ·信息提取技术发展及研究现状第14-15页
   ·本文研究的主要内容和目标第15-17页
   ·本文组织结构第17-18页
第二章 企业竞争情报基础第18-26页
   ·竞争情报概述第18-20页
     ·竞争情报定义第18-19页
     ·竞争情报特点第19-20页
     ·竞争情报价值第20页
   ·企业竞争情报系统第20-22页
     ·系统定义第20-21页
     ·系统基本功能第21-22页
     ·发展趋势第22页
   ·基于Web 的企业竞争情报系统第22-25页
     ·信息多样化第23页
     ·网络共享化第23-24页
     ·方法智能化第24-25页
     ·安全机制的新要求第25页
   ·小结第25-26页
第三章 Web 信息提取技术第26-38页
   ·信息提取中的关键技术第26-28页
     ·命名实体识别第26-27页
     ·句法分析第27页
     ·篇章分析与推理第27-28页
     ·知识获取第28页
   ·Web 文档第28-32页
     ·文本结构化程度第29页
     ·HTML 语言第29-31页
     ·网页的结构第31-32页
   ·包装器第32-33页
     ·包装器工作方式第32-33页
     ·从信息提取到包装器第33页
     ·包装器的生成第33页
   ·Web 信息提取工具的分类第33-36页
     ·基于包装器专用语言的工具第34页
     ·以HTML 结构识别的工具第34页
     ·基于自然语言处理的工具第34-35页
     ·包装器归纳工具第35页
     ·基于模型的工具第35-36页
     ·基于本体的工具第36页
   ·Web 信息提取的评价标准第36-37页
     ·漏报与误报第36-37页
     ·查全率与查准率第37页
   ·小结第37-38页
第四章 Web 页面自顶向下的正文信息提取方法第38-59页
   ·正文信息第38-42页
     ·新闻第39-40页
     ·博客第40-41页
     ·论坛第41-42页
     ·其它形式第42页
   ·HTML 节点树的构造与数据初始化第42-47页
     ·HTML Parser第42-43页
     ·构造节点树第43-45页
     ·文本信息统计第45-47页
   ·链接节点的确定第47-50页
     ·导航页文字链接率第47-48页
     ·主题型网页文字链接率第48页
     ·链接节点判定方法第48-50页
   ·正文提取第50-54页
     ·最佳正文子树第51页
     ·典型段落布局第51-52页
     ·定位最佳正文子树第52-53页
     ·从最佳正文子树中提取正文第53-54页
   ·结果测试与分析第54-58页
     ·测试方法第54-55页
     ·测试结果第55-56页
     ·进一步分析第56-58页
   ·小结第58-59页
第五章 Web 正文信息提取在企业竞争情报平台中的应用第59-82页
   ·平台简介第59-62页
     ·背景与需求第59-60页
     ·功能模块概述第60-61页
     ·开发环境第61-62页
   ·关键技术方案第62-67页
     ·业务流程第62-63页
     ·网络爬行器第63-64页
     ·信息提取器第64-65页
     ·数据库存储第65-66页
     ·索引和查询第66-67页
     ·用户接口第67页
   ·信息提取器的实现方法第67-76页
     ·有针对性地新闻信息提取方法第68-69页
     ·一般性地新闻信息提取方法第69-71页
     ·分页新闻处理第71-75页
     ·其它问题处理第75-76页
   ·信息提取器的改进方案第76-81页
     ·规则描述第76-78页
     ·可人工定制的规则学习第78-79页
     ·动态的规则学习第79-80页
     ·改进后效果第80-81页
   ·小结第81-82页
第六章 结论第82-84页
   ·总结第82页
   ·进一步工作第82-84页
致谢第84-85页
参考文献第85-90页
在学期间取得的研究成果第90-91页

论文共91页,点击 下载论文
上一篇:Web前端性能优化的研究与应用
下一篇:一种混合式P2P网络资源共享系统设计与实现