| 摘要 | 第1-5页 |
| ABSTRACT | 第5-13页 |
| 第一章 引言 | 第13-18页 |
| ·论文选题及研究意义 | 第13-14页 |
| ·信息提取技术发展及研究现状 | 第14-15页 |
| ·本文研究的主要内容和目标 | 第15-17页 |
| ·本文组织结构 | 第17-18页 |
| 第二章 企业竞争情报基础 | 第18-26页 |
| ·竞争情报概述 | 第18-20页 |
| ·竞争情报定义 | 第18-19页 |
| ·竞争情报特点 | 第19-20页 |
| ·竞争情报价值 | 第20页 |
| ·企业竞争情报系统 | 第20-22页 |
| ·系统定义 | 第20-21页 |
| ·系统基本功能 | 第21-22页 |
| ·发展趋势 | 第22页 |
| ·基于Web 的企业竞争情报系统 | 第22-25页 |
| ·信息多样化 | 第23页 |
| ·网络共享化 | 第23-24页 |
| ·方法智能化 | 第24-25页 |
| ·安全机制的新要求 | 第25页 |
| ·小结 | 第25-26页 |
| 第三章 Web 信息提取技术 | 第26-38页 |
| ·信息提取中的关键技术 | 第26-28页 |
| ·命名实体识别 | 第26-27页 |
| ·句法分析 | 第27页 |
| ·篇章分析与推理 | 第27-28页 |
| ·知识获取 | 第28页 |
| ·Web 文档 | 第28-32页 |
| ·文本结构化程度 | 第29页 |
| ·HTML 语言 | 第29-31页 |
| ·网页的结构 | 第31-32页 |
| ·包装器 | 第32-33页 |
| ·包装器工作方式 | 第32-33页 |
| ·从信息提取到包装器 | 第33页 |
| ·包装器的生成 | 第33页 |
| ·Web 信息提取工具的分类 | 第33-36页 |
| ·基于包装器专用语言的工具 | 第34页 |
| ·以HTML 结构识别的工具 | 第34页 |
| ·基于自然语言处理的工具 | 第34-35页 |
| ·包装器归纳工具 | 第35页 |
| ·基于模型的工具 | 第35-36页 |
| ·基于本体的工具 | 第36页 |
| ·Web 信息提取的评价标准 | 第36-37页 |
| ·漏报与误报 | 第36-37页 |
| ·查全率与查准率 | 第37页 |
| ·小结 | 第37-38页 |
| 第四章 Web 页面自顶向下的正文信息提取方法 | 第38-59页 |
| ·正文信息 | 第38-42页 |
| ·新闻 | 第39-40页 |
| ·博客 | 第40-41页 |
| ·论坛 | 第41-42页 |
| ·其它形式 | 第42页 |
| ·HTML 节点树的构造与数据初始化 | 第42-47页 |
| ·HTML Parser | 第42-43页 |
| ·构造节点树 | 第43-45页 |
| ·文本信息统计 | 第45-47页 |
| ·链接节点的确定 | 第47-50页 |
| ·导航页文字链接率 | 第47-48页 |
| ·主题型网页文字链接率 | 第48页 |
| ·链接节点判定方法 | 第48-50页 |
| ·正文提取 | 第50-54页 |
| ·最佳正文子树 | 第51页 |
| ·典型段落布局 | 第51-52页 |
| ·定位最佳正文子树 | 第52-53页 |
| ·从最佳正文子树中提取正文 | 第53-54页 |
| ·结果测试与分析 | 第54-58页 |
| ·测试方法 | 第54-55页 |
| ·测试结果 | 第55-56页 |
| ·进一步分析 | 第56-58页 |
| ·小结 | 第58-59页 |
| 第五章 Web 正文信息提取在企业竞争情报平台中的应用 | 第59-82页 |
| ·平台简介 | 第59-62页 |
| ·背景与需求 | 第59-60页 |
| ·功能模块概述 | 第60-61页 |
| ·开发环境 | 第61-62页 |
| ·关键技术方案 | 第62-67页 |
| ·业务流程 | 第62-63页 |
| ·网络爬行器 | 第63-64页 |
| ·信息提取器 | 第64-65页 |
| ·数据库存储 | 第65-66页 |
| ·索引和查询 | 第66-67页 |
| ·用户接口 | 第67页 |
| ·信息提取器的实现方法 | 第67-76页 |
| ·有针对性地新闻信息提取方法 | 第68-69页 |
| ·一般性地新闻信息提取方法 | 第69-71页 |
| ·分页新闻处理 | 第71-75页 |
| ·其它问题处理 | 第75-76页 |
| ·信息提取器的改进方案 | 第76-81页 |
| ·规则描述 | 第76-78页 |
| ·可人工定制的规则学习 | 第78-79页 |
| ·动态的规则学习 | 第79-80页 |
| ·改进后效果 | 第80-81页 |
| ·小结 | 第81-82页 |
| 第六章 结论 | 第82-84页 |
| ·总结 | 第82页 |
| ·进一步工作 | 第82-84页 |
| 致谢 | 第84-85页 |
| 参考文献 | 第85-90页 |
| 在学期间取得的研究成果 | 第90-91页 |