首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本信息抽取模型及算法研究

摘要第1-7页
Abstract第7-13页
插图索引第13-14页
附表索引第14-15页
第1章 综述第15-42页
   ·引言第15-17页
   ·国内外文本信息抽取研究概述第17-22页
   ·文本信息抽取模型概述第22-38页
     ·包装器模型概述第23-27页
     ·隐马尔可夫模型概述第27-38页
   ·文本信息抽取性能评价指标第38-39页
   ·本文研究内容第39-40页
   ·全文组织结构第40-42页
第2章 包装器归纳学习及平衡算法研究第42-60页
   ·概述第42-44页
   ·页面特征信息第44-46页
     ·文本模式信息第44-46页
     ·数据值的注释信息第46页
   ·包装器归纳学习算法第46-51页
     ·抽取规则的描述第46-47页
     ·有限状态机第47-48页
     ·LPWI算法第48-50页
     ·LPWI类包装器表达能力分析第50-51页
   ·包装器平衡算法第51-54页
     ·页面模板算法第51-52页
     ·包装器重新归纳学习算法第52-53页
     ·与以往包装器平衡方法的比较第53-54页
   ·实验与分析第54-59页
     ·LPWI算法的抽取实验第54-57页
     ·包装器平衡算法的实验第57-59页
   ·小结第59-60页
第3章 基于聚簇隐马尔可夫模型的文本信息抽取算法研究第60-73页
   ·概述第60-61页
   ·数据聚簇方法第61-63页
     ·相似度矩阵第61-62页
     ·数据聚簇的划分方法及其k-平均算法第62-63页
   ·基于 Markov链模型的训练文本聚簇分析第63-67页
     ·训练文本的 Markov链模型第63-64页
     ·训练文本的 Markov链模型相似度第64页
     ·初始簇中心选择算法第64-66页
     ·训练文本的Markov链模型的聚簇第66-67页
   ·基于聚簇 HMM的文本信息抽取第67-69页
   ·实验与分析第69-72页
     ·选择合适的聚簇数目的实验第69-70页
     ·基于 C-HMM和基于 HMM文本信息抽取的性能比较实验第70-72页
   ·小结第72-73页
第4章 基于信息熵隐马尔可夫模型的文本信息抽取算法研究第73-87页
   ·概述第73-74页
   ·文本信息抽取中的信息熵第74-78页
     ·最大熵模型第74-76页
     ·互信息模型第76-78页
   ·基于信息熵的HMM文本信息抽取算法第78-80页
   ·文本中部分关键信息的抽取第80-82页
     ·抽取模型结构的优化选择第80-81页
     ·抽取模型的训练第81-82页
   ·实验与分析第82-86页
     ·文本中部分关键信息的抽取实验第82-84页
     ·论文头部信息的抽取实验第84-86页
   ·小结第86-87页
第5章 基于二阶隐马尔可夫模型的文本信息抽取第87-102页
   ·概述第87-88页
   ·二阶隐马尔可夫模型第88-90页
   ·基于二阶 HMM的文本信息抽取算法第90-93页
     ·二阶 HMM的ML算法中模型参数计算公式的推导第90-91页
     ·二阶 HMM的Viterbi算法第91-92页
     ·基于二阶 HMM的文本信息抽取算法第92-93页
   ·二阶 HMM在文本信息抽取中的有效性分析第93-96页
   ·实验与分析第96-101页
     ·二阶 HMM与一阶 HMM抽取性能比较第96-98页
     ·结合文本聚簇方法的二阶 HMM抽取实验第98-100页
     ·二阶 HMM和最大熵 HMM模型的比较第100-101页
   ·小结第101-102页
第6章 结合最大熵模型和二阶隐马尔可夫模型的文本信息抽取第102-110页
   ·相关抽取模型概述第102-103页
   ·结合最大熵和二阶 HMM的文本信息抽取第103-107页
     ·二阶 HMM的状态转移概率和观察值输出概率第103-104页
     ·结合最大熵模型的二阶 HMM相关参数训练第104-107页
   ·相关抽取模型的性能比较实验第107-109页
   ·小结第109-110页
第7章 文本信息抽取中的主动学习算法研究第110-122页
   ·概述第110-111页
   ·基于部分标记训练文本的主动学习算法第111-113页
   ·基于主动学习的文本信息抽取第113-117页
     ·基于主动学习的HMM文本信息抽取第113-116页
     ·基于主动学习算法的包装器归纳学习第116-117页
   ·实验与分析第117-120页
     ·HMM的主动学习性能实验第117-120页
     ·包装器模型的主动学习性能实验第120页
   ·小结第120-122页
总结与展望第122-126页
参考文献第126-135页
致谢第135-136页
附录A 攻读学位期间撰写的研究论文第136-137页
附录B 攻读学位期间参与的科研项目第137页

论文共137页,点击 下载论文
上一篇:小学英语教学中的师生体态语研究
下一篇:基于RAMSIS的轿车内部人机工程布置与分析