半结构化网页中商品属性抽取方法研究

中文摘要	第1-5页
Abstract	第5-10页
第一章绪论	第10-17页
·研究背景	第10-11页
·国内外研究现状	第11-14页
·研究内容	第14-16页
·本文结构	第16-17页
第二章任务体系及相关技术介绍	第17-31页
·任务体系介绍	第17-22页
·任务定义	第17-18页
·语料来源与分析	第18-21页
·网页信息抽取的评价方法介绍	第21-22页
·网页信息抽取技术分类	第22-25页
·基于自然语言处理方法的信息抽取	第22-23页
·基于机器学习归纳包装器的信息抽取	第23-24页
·基于本体知识的信息抽取	第24页
·基于结构分析的信息抽取	第24-25页
·网页信息抽取相关技术介绍	第25-29页
·超文本标记语言简介	第25-27页
·基于视觉的网页切分算法简介	第27-29页
·本章小结	第29-31页
第三章基于属性描述网页块定位的商品属性抽取	第31-46页
·算法总体框架	第31-32页
·商品属性描述网页块的定位	第32-37页
·属性描述网页块的定义及分析	第33-34页
·基于视觉信息的网页分块	第34页
·网页块特征提取	第34-37页
·基于分类器的商品属性描述网页块定位	第37页
·属性名-值对抽取	第37-40页
·文本预处理	第37-38页
·基于单位词表的潜在商品属性值的判定	第38-39页
·商品属性信息对齐	第39-40页
·实验设计及结果分析	第40-44页
·语料的构建及评价标准	第40-41页
·评价方法	第41-42页
·基准方法	第42页
·实验结果和分析	第42-44页
·本章小结	第44-46页
第四章基于网页标题构建模板的商品属性抽取	第46-59页
·算法总体框架	第46-47页
·领域属性词包的构建	第47-48页
·网页文本片段的细分	第48-49页
·种子属性名-值对提取	第49-50页
·优质属性文本片段的筛选	第49-50页
·双向扩展构建种子属性名-值对	第50页
·优质模板的学习	第50-53页
·候选模板构建与筛选	第51-52页
·加权词表的引入	第52页
·优质模板选择	第52-53页
·基于模板的商品属性名-值对抽取	第53页
·实验及分析	第53-58页
·实验语料构建	第53-54页
·基准方法	第54-55页
·语料分析	第55-56页
·实验结果分析	第56-58页
·本章小结	第58-59页
第五章总结与展望	第59-61页
·本文工作	第59-60页
·工作展望	第60-61页
参考文献	第61-65页
攻读学位期间公开发表的论文	第65-66页
致谢	第66-67页