基于结构语义熵的互联网商品信息抽取技术研究
| 摘要 | 第1-5页 |
| Abstract | 第5-6页 |
| 第一章 绪论 | 第6-9页 |
| ·研究背景 | 第6-7页 |
| ·本文研究的内容 | 第7页 |
| ·本文结构 | 第7-9页 |
| 第二章 商品销售网页主要特征及相关技术综述 | 第9-19页 |
| ·商品销售网页的主要特征 | 第9-12页 |
| ·网页信息抽取技术 | 第12-17页 |
| ·网页信息抽取流程 | 第12-13页 |
| ·网页信息抽取方法研究 | 第13-14页 |
| ·网页信息抽取系统的评价标准 | 第14-17页 |
| ·语义词典与本体研究 | 第17-19页 |
| 第三章 互联网商品信息自动抽取框架 | 第19-24页 |
| ·互联网商品信息抽取框架概述 | 第19-20页 |
| ·利用元搜索技术获取新网站 | 第20-22页 |
| ·网页获取 | 第22-23页 |
| ·基于结构语义熵的信息抽取引擎 | 第23-24页 |
| 第四章 基于结构语义熵的商品信息抽取算法 | 第24-43页 |
| ·商品语义词典设计 | 第24-27页 |
| ·语义词典的设计要求 | 第24-25页 |
| ·语义词典结构 | 第25-27页 |
| ·基于结构语义熵的商品信息抽取算法 | 第27-37页 |
| ·网页预处理与结构分析 | 第27-28页 |
| ·计算节点的结构语义熵 | 第28-31页 |
| ·根据结构语义熵查找商品子树 | 第31-35页 |
| ·在选定的商品结构树内抽取属性值 | 第35-37页 |
| ·相关实验 | 第37-43页 |
| ·实验数据准备 | 第37-38页 |
| ·识别商品子树 | 第38-41页 |
| ·抽取商品属性标签和值对 | 第41-43页 |
| 第五章 应用案例分析 | 第43-48页 |
| ·项目背景 | 第43-44页 |
| ·项目应用分析 | 第44-46页 |
| ·项目应用效果 | 第46-48页 |
| 第六章 总结 | 第48-50页 |
| ·结论 | 第48页 |
| ·展望 | 第48-50页 |
| 参考文献 | 第50-52页 |
| 致谢 | 第52-53页 |