摘要 | 第1-7页 |
ABSTRACT | 第7-11页 |
第一章 绪论 | 第11-17页 |
·信息抽取的背景与意义 | 第11-12页 |
·信息抽取国内外研究现状 | 第12-13页 |
·信息抽取现阶段存在的问题及未来的挑战和趋势 | 第13-14页 |
·信息抽取存在的问题 | 第13-14页 |
·信息抽取的发展趋势 | 第14页 |
·论文的研究目标和工作内容 | 第14-15页 |
·论文的组织结构 | 第15-16页 |
·本章小结 | 第16-17页 |
第二章 相关理论基础与技术方法 | 第17-31页 |
·信息抽取的基本概念 | 第17-19页 |
·信息抽取的定义 | 第17-18页 |
·信息抽取的任务及常用方法 | 第18-19页 |
·网页信息抽取的基本概念和方法 | 第19-21页 |
·网页信息抽取的定义 | 第19-20页 |
·网页信息抽取的主流方法 | 第20-21页 |
·隐马尔可夫模型 | 第21-30页 |
·隐马尔可夫模型简介 | 第23-25页 |
·隐马尔科夫模型的三个主要问题及解决算法 | 第25-29页 |
·数据稀疏问题及解决方法 | 第29-30页 |
·本章小结 | 第30-31页 |
第三章 基于最大熵原理提出的改进的隐马尔科夫模型 | 第31-45页 |
·扩展HMM前提假设的改进方法 | 第31-37页 |
·扩展HMM前提假设的基本理论 | 第32-33页 |
·二阶隐马尔可夫模型 | 第33-37页 |
·改进的隐马尔可夫模型的思想概述 | 第37-43页 |
·最大熵原理 | 第38-40页 |
·改进的隐马尔可夫模型的定义 | 第40-43页 |
·本章小结 | 第43-45页 |
第四章 基于改进的隐马尔科夫模型在网页信息抽取中解决方案的设计 | 第45-57页 |
·网页信息抽取模型设计概览 | 第45-48页 |
·网页数据准备阶段 | 第48-51页 |
·数据预处理 | 第48-49页 |
·模型结构的选择 | 第49-51页 |
·模型训练阶段的设计实现 | 第51-54页 |
·改进的HMM相关参数的训练 | 第51-53页 |
·针对模型参数进一步优化的改进建议 | 第53-54页 |
·完成信息抽取阶段 | 第54-55页 |
·改进的viterbi算法 | 第54-55页 |
·本章小结 | 第55-57页 |
第五章 基于改进的隐马尔可夫模型在网页信息抽取中研究的实验性验证 | 第57-65页 |
·信息抽取的评价指标 | 第57-58页 |
·验证改进的HMM的有效性 | 第58-60页 |
·基于改进的HMM的网页信息抽取模型的评估 | 第60-63页 |
·数据集大小对训练结果的影响 | 第62-63页 |
·本章小结 | 第63-65页 |
第六章 总结与展望 | 第65-67页 |
·论文的特色 | 第65-66页 |
·后续工作展望 | 第66-67页 |
参考文献 | 第67-73页 |
作者简历及攻读硕士学位期间发表的学术论文 | 第73-75页 |
致谢 | 第75页 |